Bahan Ajar Statistika Haryadi NIDN 000311640 Universitas Muhammadiyah Palangkaraya 2012 Daftar Isi 1 Populasi dan Sampel 1.1 Pengantar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Sifat variabel dalam penelitian . . . . . . . . . . . . . . . . . . . 1 1 4 2 Penyajian Data 2.1 Distribusi Frekuensi . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Histogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Diagram Batang dan Daun . . . . . . . . . . . . . . . . . . . . . 7 7 9 12 3 Ringkasan Data 3.1 Ukuran Kecenderungan Pusat 3.2 Varian . . . . . . . . . . . . . 3.3 Persentil . . . . . . . . . . . . 3.4 Box Plot . . . . . . . . . . . . 3.5 Teorema Chebyshev . . . . . 15 15 18 19 21 22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Peluang 23 4.1 Ruang Sampel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.2 Peluang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.3 Peluang Bersyarat . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 Variabel Random 5.1 Variabel Random Diskrit . . . . . . . . 5.2 Nilai Harapan Variabel Random Diskrit 5.3 Variabel Random Kontinu . . . . . . . . 5.4 Variabel Random Bersama . . . . . . . 6 Beberapa Distribusi Peluang 6.1 Distribusi binomial . . . . . . . . . . 6.2 Distribusi Normal . . . . . . . . . . . 6.3 Distribusi yang berhubungan dengan 6.3.1 Distribusi Chi-Square . . . . 6.3.2 Distribusi t . . . . . . . . . . 6.3.3 Distribusi F . . . . . . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 31 35 36 36 . . . . . . . . . . . . . . . . . . . . distribusi normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 39 40 43 43 43 44 . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii DAFTAR ISI 7 Teori Sampling 8 Estimasi 8.1 Interval 8.2 Interval 8.3 Interval 8.4 Interval Kepercayaan Kepercayaan Kepercayaan Kepercayaan 45 untuk µ dengan σ Diketahui . . . . untuk µ dengan σ Tidak Diketahui untuk σ 2 . . . . . . . . . . . . . . . Selisih Dua Mean . . . . . . . . . . . . . . . . . . . . . . . . . . 49 50 52 53 54 9 Uji Hipotesis 9.1 Uji tentang mean populasi normal . . . . . . . . . 9.1.1 Uji hipotesis dengan σ 2 diketahui . . . . . . 9.1.2 Uji hipotesis dengan σ 2 tidak diketahui . . 9.2 Uji kesamaan mean dua populasi . . . . . . . . . . 9.2.1 Varian populasi diketahui . . . . . . . . . . 9.2.2 Varian populasi tidak diketahui . . . . . . . 9.2.3 Varian tidak diketahui dan tidak sama . . . 9.3 Uji t berpasangan . . . . . . . . . . . . . . . . . . 9.4 Uji hipotesi tentang varian populasi normal . . . . 9.5 Uji hipotesis kesamaan varian dua populasi normal 9.6 Uji Goodness of Fit . . . . . . . . . . . . . . . . . . 9.7 Uji Independen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 58 58 61 62 63 64 66 66 67 68 70 71 10 Regresi Linear Sederhana 10.1 Sifat Estimator β̂ dan α̂ . . . 10.2 Inferensi tentang parameter β 10.3 Koefisien Determinasi . . . . 10.4 Korelasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 77 78 79 80 . . . . dan α . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Daftar Pustaka 81 Appendix 83 Bab 1 Populasi dan Sampel 1.1 Pengantar Banyak kesimpulan sehari-hari didasarkan pada informasi yang tidak lengkap. Kesimpulan semacam ini tentu mengandung ketidak pastian. Di dalam statistika, kita akan mempelajari bagaimana menggali informasi atau membuat kesimpulan berdasarkan informasi yang tidak lengkap. Definisi 1. Statistika merupakan studi tentang bagaimana mengumpulkan, mengorganisasi, menganalisis dan menginterpretasikan data. Dengan demikian persyaratan untuk dapat melakukan studi dengan statistika adalah adanya data. Data diperoleh dengan melakukan observasi dari karakter individu-indvidu yang menjadi perhatian kita. Sering terjadi data yang diperlukan dalam studi statistik sudah tersedia, misalnya data yang diterbitkan oleh Badan Pusat Statistik. Dapat pula terjadi data yang diperlukan dalam studi belum tersedia. Dalam hal data belum terdesia maka perlu diadakan dengan jalan melakukan observasi atau eksperimen. Definisi 2. Variabel adalah karakteristik yang diukur atau diobservasi dari suatu objek. Variabel kuantitatif adalah variabel yang dinyatakan dalam bentuk bilangan atau numerik. Variabel kualitatif adalah variabel yang dinyatakan dalam kategori atau 1 2 BAB 1. POPULASI DAN SAMPEL kelompok tertentu Jika kita ingin meneliti prestasi belajar siswa suatu kelas, maka variabelnya dapat berupa nilai hasil belajar. Penelitian tentang tingkat kemasaman air di Palangkaraya, variabelnya bisa berupa pH air. Suatu penelitian yang bertujuan untuk mengetahui jenis warna yang disukai anak TK, variabelnya dapat berupa warna. Definisi 3. Populasi adalah kumpulan semua individu ( objek) yang menjadi perhatian studi. Bagian dari populasi dinamakan sampel. Banyaknya anggota populasi dinamakan ukuran populasi. Banyaknya anggota sampel dinamakan ukuran sampel. Data yang diperoleh dari sampel dinamakan data sampel. Contoh 1. Suatu studi bertujuan untuk mengetahui berat badan rata-rata mahasiswa UM Palangkaraya. Karena keterbatasan tenaga dan waktu, maka diambil sampel 100 orang mahasiswa untuk timbang berat badannya. Dalam studi ini, populasinya adalah seluruh mahasiswa UM Palangkaraya, sampelnya adalah ke 100 mahasiswa tersebut, dan variabelnya adalah berat badan yang merupakan variabel kuantitatif. Jelas bahwa rata-rata berat badan yang diukur dari 100 mahasiswa tidak menjamin akan mencerminkan rata-rata berat badan seluruh mahasiswa UM Palangkaraya. Hal ini dikarenakan informasinya tidak lengkap. Dalam hal ini bisa saja seluruh mahasiswa UM Palangkraya ditimbang berat badanya agar diperoleh kesimpulan yang tepat, namun tentu diperlukan waktu dan biaya yang lebih besar dibanding dengan mengamati 100 mahasiswa. Dalam suatu studi umumnya kita menggunakan dapat sampel. Banyak alasan mengapa kita mengunakan data sampel, diantaranya (i) keterbatasan sumberdaya dan (ii) keterbatasan teknis. Definisi 4. Parameter adalah suatu karateristik populasi. Statistik adalah suatu nilai yang dihitung dari data sampel. Pada contoh 1, parameternya adalah rata-rata berat badan seluruh mahasiswa UM Palangkaraya, yang dalam hal ini nilainya tidak diketahui; sedangkan 1.1. PENGANTAR 3 statistiknya adalah rata-rata berat badan yang dihitung dari ke 100 mahasiswa tersebut. Parameter umunya tidak diketahui nilainya. Oleh karena itu kita harus cukup puas untuk menduga nilai parametr. Statistik digunakan untuk menduga (to estimasi) parameter. Suatu statistik dikatakan representatif (mewakili) jika dapat menggambarkan keadaan parameter dengan baik. Ada banyak kriteria mengenai statistik yang baik untuk suatu parameter. Baik tidaknya suatu statistik sangat bergantung pada bagaimana sampel tersebut diambil dari populasi. Suatu proses pengambilan sampel dinamakan sampling. Cara pengambilan sampel Ada beberapa cara pengambilan sampel: • Random sampling • Stratified sampling • Sistematik sampling • Cluster sampling Sampel random berukuran n dari suatu populasi adalah bagian populasi yang diambil dengan cara sedemikian sehingga: 1. setiap sampel berukuran n memiliki kesempatan yang sama untuk terpilih. 2. setiap anggota populasi memiliki kesempatan yang sama untuk terpilih. Suatu prosedur untuk memperoleh sampel random adalah dengan menggunakan bilangan random. Bilangan random dapat diperoleh pada tabel bilangan random, kalkulator atau program komputer. Prosedur melakukan random sampling: 1. Beri nomor semua anggota populasi secara berurutan 2. Gunakan tabel, kalkulator atau komputer untuk memilih bilangan random. 3. Buatlah sampel dengan menggunakan anggota populasi yang nomornya berkaitan dengan bilangan random yang terpilih. Contoh 2. Akan diambil sampel random berukuran 10 dari sebuah kelas yang memiliki 50 siswa. Langkah-langkahnya: 1. Beri nomor urut pada setiap anggota kelas mulai nomor 1 sampai dengan nomor 50. 4 BAB 1. POPULASI DAN SAMPEL 2. Gunakan tabel bilangan random, dengan cara: pertama tunjuk sebarang bilangan pada tabel, kemudian diteruskan dengan menuliskan bilangan random berikutnya secukupnya. Misal dalam contoh ini diperoleh bilangan random mulai baris ke-7 dan kolom ke-9: 66 16391 94730 99938 95761 90704 75023 93621 48464 66330 65544 33393 96583 95261 18911 Karena banyaknya sampel merupakan bilangan dua digit, maka bilangan random di atas dikelompokan menjadi dua digit : 66 64 99 39 94 65 93 39 73 54 89 52 09 49 07 61 57 65 04 61 83 93 75 18 62 02 91 16 34 11 63 84 63 30 91 33 3. Daftar semua anggoka kelas yang nomornya sesuai dengan nomor pada bilangan random yang telah dikelompokan tersbut. Jika ditemui bilangan yang lebih besar dari 50 maka diabaikan, dan jika diperoleh bilangan random yang sudah terpilih sebelumnya, maka diabaikan. Anggota populasi yang terpilih sebagai anggota sampel adalah yang bernomor: 09 02 34 49 18 11 07 04 16 30 33. Stratified sampling Stratified sampling adalah cara pengambilan sampel dari populasi yang memiliki strata tertentu. Misalnya, pada populasi mahasiswa UM Palangkaraya, stratanya dapat berupa lulusan SMA, sudah bekerja dan mahasiswa pindahan. Pada teknik ini, populasi dibagi minimal dalam dua strata, kemudian pada setiap strata pengambilan sampel dilakukan secara random sampling. Sistematik sampling. Pada metode ini anggota populasi disusun dengan urutan tertentu. Kemudian dilakukan pengambilan satu individu secara random, dan dilanjutkan dengan mengambil setiap anggota ke k dari sampel. Cluster sampling . Pada metode ini, dimulai dengan membagi wilayah menjadi beberapa bagian (cluster). Kemudian diambil secara random bagianbagian tersebut. Setiap anggota cluster menjadi anggota sampel. 1.2 Sifat variabel dalam penelitian Didalam studi observasi, pengukuran terhadap anggota sampel dilakukan sehingga tidak merubah respon atau variabel yang diteliti. Di dalam eksperimen, perlakuan diberikan pada individu untuk melihat perubahan respon atau variabel yang diukur. 1.2. SIFAT VARIABEL DALAM PENELITIAN 5 Untuk memperoleh data, kadang-kadang peneliti harus mengambil data dari orang-orang dengan cara memberikan pertanyaan. Proses ini dinamakan survey. Pengkategorian lain dari data adalah berdasarkan tingkat pengukuran, dalam arti berdasarkan sifat aritmetika data. Berdasarkan tingkat mengukuran, data dikelompokan menjadi: 1. Data nominal merupakan data yang tidak dapat (tidak berkmakna) jika diurutkan secara aritmetika. 2. Data ordinal, yaitu data yang bisa diurutkan tetapi tidak dapat (tidak bermakna) jika dibandingkan. 3. Data interval, yaitu data yang dapat urutkan dan perbedaan antara nilai data ada maknanya. 4. Data rasio, yaitu data yang dapat dirutkan, perbedan antara nilai data bermakna dan rasio antar nilai data juga bermakna. Pada data rasio nilai 0 merupakan nilai sebenarnya. Contoh 3. Suatu data berisi informasi nama hewan di suatu kebun binatang: harimau jerapah buaya unta Data ini termasuk data nominal. Perhatikan bahwa data tersebut hanya menyatakan nama, jadi jika diurutkan tidak ada artinya. Contoh 4. Suatu penelitian bertujuan untuk mengetahui tingkat kesukaan konsumen terhadap suatu produk. Variabel yang diamati adalah sebagai berikut: Suka Sedang Tidak suka Perhatikan bahwa data ini dapat diurutkan, namun selisih antar tingkat kesukaan tidak bermakna. Contoh 5. Temperatur di kota Palangkaraya merupakan data interval, sebab nilai temperatur dapat diurutkan dan selisih antara nilai temperatur memiliki makna. Misalnya pada pagi hari temperaurnya 23o dan pada siang hari 30o , perbedaaanya menyatakan bahwa pada siang hari temperaturnya 7o lebih panas dibanding pagi hari. Perhatikan pula bahwa temperatur 0o tidak berarti tidak ada panas, yakni nilai ini bukan nilai sebenarnya. Contoh 6. Data penghasil 5 orang per bulan (dalam juta rupiah) adalah sebagai berikut: 6 BAB 1. POPULASI DAN SAMPEL No. Urut. Penghasilan 1. 2 2. 4,5 3. 13 4. 0,5 5. 0,0 Sifat data ini adalah dapat urutkan, dapat dikurangkan antar nilai-nilainya dan nilai 0 adalah nilai yang sebenarnya, yaitu tidak punya penghasilan. Dengan demikian data ini termasuk data rasio. Bab 2 Penyajian Data 2.1 Distribusi Frekuensi Jika kita memiliki suatu data kuantitatif yang ukuran cukup besar, maka akan berguna jika data tersebut dikelompokan menjadi interval atau klas yang lebih kecil. Dalam penyajian data dengan tabel frekuensi, data dipartisi menjadi kelas atau interval dan menampilkan banyaknya nilai data yang termasuk pada setiap kelas. Definisi 5. • Kelas atau interval dibentuk sehingga setiap nilai data termasuk kedalam tepat satu kelas. • Kelas berupa interval bilangan; jadi memiliki batas bawah dan batas atas. • Titik tengah kelas adalah bilangan yang posisinya di tengah kelas. • Lebar kelas menyatakan selisih antara batas atas dan batas bawah kelas tersebut. Lebar kelas = N ilai data terbesar − banyaknya N ilai data terkecil kelas • Frekuensi kelas adalah banyaknya nilai yang termasuk suatu kelas. • Frekuensi relatif adalah frekuensi dibagi banyaknya nilai data. 7 8 BAB 2. PENYAJIAN DATA • Frekuensi Kumulatif suatu kelas adalah banyaknya seluruh nilai data yang lebih kecil dari batas atas kelas tersebut. • Frekuensi kumulatif banyaknya data. relatif adalah frekuensi kumulatif dibagi Contoh 7. Data hasil ujian mata kuliah Statistika 40 mahasiswa berikut akan disajikan dalam bentuk frekuensi distribusi dengan 6 kelas.: 78 60 68 67 60 76 87 58 45 65 95 78 65 60 54 65 80 55 67 89 95 54 58 85 40 75 87 76 40 84 56 68 46 48 43 64 55 58 56 60 Langkah-langkah membentuk tabel frekuensi: 1. Tentukan lebar kelas: Lebarkelas = 95 − 40 = 9.16. 6 dibulatkan menjadi 10. 2. Tentukan kelas (interval kelas) sebagai berikut: • Ambil nilai data terkecil sebagai batas bawah kelas pertama, dalam hal ini adalah 40. • Batas bawah kelas berikutnya = batas bawah nilai sebelumnya + 10. Jadi batas bawah kelas kedua adalah 40 + 10 = 50. • Batas bawah kelas diperoleh dengan mengambil nilai tepat di bawah batas atas kelas berikutnya. Jadi batas kelas pertama adalah 59. • Proses ini dilanjutkan untuk kelas-kelas berikutnya. 3. Sekarang setiap nilai data dapat dimasukan ke dalam kelas masing-masing. Untuk menghitung frekuensi setiap kelas dapat menggunakan dengan bantuan tally. Diperoleh tabel frekuensi sebagai berikut: 2.2. HISTOGRAM 2.2 9 Interval Kelas Frekuensi Frekuensi Relatif Frekuensi Kumulatif 40-49 50-59 60-69 70-79 80-89 90-99 Jumlah 6 9 12 5 6 2 40 0.15 0.225 0.3 0.125 0.15 0.05 1 6 15 27 32 38 40 Frekuensi Kumulatif Relatif 0.15 0.375 0.675 0.800 0.950 1.00 Histogram Dari tbel frekuensi dapat disajikan bentuk visualnya. Histogram merupakan cara yang cukup efektif untuk menyajikan data dalam bentuk visual. Pada histogram: • setiap kelas dinyatakan dengan sebuah batang • lebar batang menyatakan lebar kelas • tinggi batang menyatakan frekuensi kelas atau frekuensi relatif kelas • nilai dibawah setiap batang adalah titik tengah kelas. Histogram frekuensi pada contoh 1 adalah 10 BAB 2. PENYAJIAN DATA Bentuk histogram dari suatu sampel random menggambarkan bagaimana nilai data berdistribusi pada populasi. Bentuk histogram dapat dikelompokan menjadi: 1. Simetris, yaitu histogram yang mentuknya (hampir) simetris terhadap suatu sumbu. 2. Seragam, yaitu histogram yang frekuensi setiap kelasnya sama atau hampir sama. 3. Menceng kiri atau menceng kanan, yaitu histogram yang ekornya menjulur lebih panjang ke satu sisi. Jika ekornya lebih menjulur kekiri maka dinamakan menceng kekiri, jika ekornya lebih menjulur kekanan maka dinamakan menceng kekanan. 4. Bimodal, yaitu histogram yang memiliki dua kelas dengan frekuensi tertetinngi yang dipisahkan oleh kelas lainnya. 2.2. HISTOGRAM 11 Kadang-kadang kita ingin menyajikan histogram dengan bentuk tertentu. Diagram pareto adalah grafik batang yang disajikan secara urut berdasarkan tingginya. Sebagai contoh, diagram pareto untuk contoh 1 adalah: Grafik runtun waktu adalah grafik yang menggambarkan bagaimana data berubah terhadap waktu. Misalnya data mahasiswa UM Palangkaraya 10 tahun terakhir adalah 12 BAB 2. PENYAJIAN DATA 2003 3900 2004 4500 2005 4200 2006 3300 2007 3600 2008 3000 2009 3100 2010 3200 2011 3400 2012 3500 Grafik runtun waktu data ini adalah 2.3 Diagram Batang dan Daun Diagram batang dan daun menyajikan data dalam bentuk susunan dan kelompok tertentu. Didalam tabel frekuensi dan histogram, kita kehilangan informasi tentang nilai data. Di dalam diagram batang dan daun, informasi mengenai nilai data asli tidak hilang. Prosedur membuat diagram batang-daun: 1. Bagi digit tiap nilai data menjadi dua bagian. Bagian paling kiri dinamakan batang dan bagian kanan dinamakan daun. 2. Susun semua batang secara vertikal mulai dari nilai terkecil hingga nilai terbesar. 3. Tuliskan semua daun yang batangnya sama pada baris batang yang sama, lalu susun daun dengan urutan makin membesar. Contoh 8. Data nilai ujian Statistika pada contoh 1 akan disajikan dalam diagram batang daun. Digit pertama sebagai batang dan digit kedua sebagai daun. Berdasarkan prosedur di atas diperoleh 2.3. DIAGRAM BATANG DAN DAUN 4 5 6 7 8 9 0 4 0 5 0 5 0 4 0 6 4 5 3 5 0 6 5 5 5 0 8 7 6 6 4 8 7 8 6 8 8 5 5 5 7 7 8 8 9 13 14 BAB 2. PENYAJIAN DATA Bab 3 Ringkasan Data 3.1 Ukuran Kecenderungan Pusat Dalam keseharian kita sering mendengar ungkapan seperti: • Umumnya orang Indonesia makan nasi. • Sebagian besar siswa lulus UAN. • Pendapatan per kapita rata-rata di Palangkaraya 4 juta rupiah per bulan. Ungkapan-ungkapan tersebut merupakan ungkapan kecenderungan suatu keadaan. Di dalam bagian ini kita akan meninjau dari sudut statistika cara menyapaikan ungkapan-ungkapan tersebut. Modus suatu data adalah nilai data yang paling banyak frekuensinya. Contoh 9. Data banyaknya anak 10 rumah tangga adalah sebagai berikut: 2 0 2 1 2 3 4 3 2 1 Nilai data 2 memiliki frekuensi paling banyak, oleh karena itu modusnya adalah 2. Median adalah nilai data yang posisinya ditengah setelah data diurutkan. Median data dapat dicari sebagai berikut: 1. Urutkan data dari nilai terkecil hingga terbesar. 2. Jika banyaknya nilai data ganjil, maka median = nilai yang posisinya ditengah. 3. Jika banyaknya nilai data genap, maka median = jumlah dua nilai yang ditengah . 2 15 16 BAB 3. RINGKASAN DATA Contoh 10. Hasil pengukuran tinggi badan 11 mahasiswa (dalam kg) adalah 67 60 70 55 58 76 63 76 81 65 72 67 70 72 76 76 81 Setelah diurutkan maka menjadi 55 58 60 63 65 Karena banyaknya nilai data ada 11, maka mediannya adalah nilai yang posisinya ditengah, yaitu nilai ke 6. Dengan demikian mediannya adalah 67. Contoh 11. Data pendapatan per bulan 10 orang adalah sebagai berikut (dalam juta rupiah) 4 4 6 3 5 3 2 5 1 3 5 5 6 Setelah diurutkan, maka data tersebut menjadi 1 2 3 3 3 4 4 Karena banyaknya observasi 10 (genap), maka mediannya adalah 3+4 nilai ke 5 + nilai ke 6 = = 3.5. 2 2 Mean atau mean aritmetika suatu sampel adalah jumlah seluruh nilai data dibagi ukuran sampel. Mean suatu sampel berukuran n dengan nilai-nilai data x1 , x2 , · · · , xn , ditulis x̄. Jadi median = n mean = x̄ = x1 + x2 + · · · + xn 1X = xi . n n i=1 Contoh 12. Nilai rapor semua pelajaran seorang siswa adalah 7, 8, 6, 7, 6, 8, 7, 9, 6, 7. Mean nilai rapornya adalah 7+8+6+7+6+8+7+9+6+7 71 = = 7.1. 10 10 Mean memiliki sifat sensitif terhadap nilai data ekstrim, dalam arti bahwa jika terdapat nilai data yang sangat kecil atau sangat besar, maka mean mudah berubah secara ekstrim. x̄ = Contoh 13. Data observasi tingkat penghasilan 10 orang di Palangkaraya per bulan adalah sebagai berikut (dalam juta rupiah): 1, 3, 2, 4, 3, 100, 3, 4, 2, 4. Di dalam contoh ini terdapat orang yang penghasilannya 100 juta per bulan. Mean data ini adalah 1 + 3 + 2 + 4 + 3 + 100 + 3 + 4 + 2 + 4 = 12.6, x̄ = 10 padahal umumnya ke 10 orang berpenghasilan dibawah 5 juta. Hal ini terjadi karena ada nilai data yang ekstrim, yaitu 100. Trimmed mean atau mean yang dipangkas relatif tidak sensitif terhadap nilai data ekstrim. Trimmed mean adalah mean suatu data yang telah dipangkas sebagian data, umumnya digunakan pemangkasan 5 persen. 3.1. UKURAN KECENDERUNGAN PUSAT 17 Prosedur mencari trimmed mean 5 persen 1. Urutkan data dari nilai terkecil hingga nilai terbesar. 2. Hapus 5 persen bawah dan 5 persen atas data. Jika 5 persen tersebut tidak menghasilkan bilangan bulat, bulatkan ke bilangan bulat terdekat. 3. Hitung mean 90 persen data yang tersisa. Contoh 14. Data penghasilan per bulan 20 orang dalam juta rupiah adalah sebagai berikut 3 2 3 1 4 5 4 6 3 5 4 100 4 5 7 8 4 Untuk mencari trimmed mean 5 persen pertama-tama data diurutkan 6 1 2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7 Banyaknya nilai data adalah 20, sehingga 5 persen dari 20 adalah 1. Dihilangkan 5 persen (satu nilai data) bawah dan atas data menjadi 7 2 3 3 3 4 4 4 4 4 5 5 5 6 6 Mean yang dipangkas adalah mean data terakhir, yaitu 8 6 7 7 7 8 6 100 1 (2 + 3 + 3 + 3 + 4 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 6 + 6 + 6 + 7 + 7 + 8) = 4.78. 18 Kadang-kadang kita memiliki data yang nilainya dapat dikelompokan menjadi k nilai berbeda. Misalkan nilai data x1 , x2 , · · · , xk berturut-turut memiliki Pk frekuensi f1 , f2 , · · · , fk . Ini berarti data ini memiliki n = i=1 fi nilai data dengan nilai xi terjadi fi kali. Mean data demikian dapat dihitung sebagai berikut 1 x̄ = (f1 x1 + f2 x2 + · · · + fk xk ). n dengan n = fi + f2 + · · · + fk . x̄ = Contoh 15. Berikut adalah data hasil observasi usia mahasiswa pada suatu kelas Usia 16 17 18 19 20 21 22 Frekuensi 2 4 7 8 6 3 2 Banyaknya observasi adalah n = 2 + 4 + 7 + 8 + 6 + 3 + 2 = 32. Mean data tersebut adalah 1 605 x̄ = (2 · 16 + 4 · 17 + 7 · 18 + 8 · 19 + 6 · 20 + 3 · 21 + 2 · 22) = = 18.91. 32 32 18 BAB 3. RINGKASAN DATA Kadang-kadang nilai data yang akan dicari meannya sangat besar. Untuk mempermudah mencari mean data yang nilai-nilainya sangat besar dapat digunakan transformasi: yi = xi − c dengan c suatu konstanta. Dengan tranfomasi tersebut, maka diperoleh x̄ = ȳ + c. Contoh 16. Suatu eksperimen untuk mengukur kecepatan cahaya menghasilkan hasil pengukuran sebagai berikut (dalam km/detik): 300, 009 299, 999 299, 998 300, 099 300, 008. Untuk mencari mean data tersebut dapat digunakan tranformasi yi = xi − 300, 000, dan diperoleh nilai-nilai yi : 9 −1 −2 99 8, dan 1 (9 − 1 − 2 + 99 + 8) = 22.6. 5 Dengan demikian, mean hasil pengukuran kecepatan cahaya tersebut adalah ȳ = x̄ = ȳ + 300, 000 = 22.6 + 300, 000 = 300, 022.6. 3.2 Varian Kita sering mendengar pernyataan seperti ”Tingkat pendapatan orang Indonesia sangat bervariasi”, ”Hasil nilai ujian nasional cukup beragam”, ”Tinggi tanaman padi di sawah sangat seragam”, dan sebagainya. Ungkapan semacam ini merupakan suatu cara untuk menyatakan kecenderungan perbedaan antara individu. Range data x1 , x2 , · · · , xn adalah selisih antara nilai data terbesar dan nilai data terkecil. Contoh 17. Nilai ujian 10 orang siswa adalah 5, 6, 4, 7, 8, 7, 10, 6, 7, 4. Range data tersebut adalah 10 − 4 = 6. Diketahui x1 , x2 , · · · , xn data sampel berukuran n dan x̄ mean data tersebut. Deviasi nilai data xi terhadap mean x̄ adalah selisih antara xi dan x̄, yaitu deviasi = xi − x̄. 3.3. PERSENTIL 19 Varian sampel, ditulis s2 , dari data x1 , x2 , · · · , xn didefinisikan n s2 = 1 X (xi − x̄)2 . n − 1 i=1 Varian sampel menggambarkan variabilitas data sampel. Jika s2 adalah varian sampel, maka s dinamakan deviasi standar sampel. Contoh 18. Hitunglah varian sampel setiap data berikut: Data A: 5, 3, 4, 6, 2. Data B: -2, -1, 11, 4, 8. Mean data A adalah x̄ = (5 + 3 + 4 + 6 + 2)/5 = 4; dengan demikian varian sampel data A adalah 1 (5 − 4)2 + (3 − 4)2 + (4 − 4)2 + (6 − 4)2 + (6 − 4)2 + (2 − 4)2 4 10 = = 2.5, 4 √ dan deviasi standar data A adalah s = 2.5 = 1.58. s2 = Mean data B adalah x̄ = (−2 − 1 + 11 + 4 + 8)/5 = 4; dengan demikian varian sampel data B adalah 1 (−2 − 4)2 + (−1 − 4)2 + (11 − 4)2 + (4 − 4)2 + (8 − 4)2 4 126 = = 31.5 4 √ dan deviasi standar data B adalah s = 31.5 = 5.61. s2 = Perhatikan bahwa meskipun data A dan data B memiliki mean sama, namun variannya berbeda. Varian data B lebih besar dibanding varian data A, yang berarti bahwa data B lebih bervariasi dibanding data A. 3.3 Persentil Diketahui bilangan p dengan 1 ≤ p ≤ 99. Persentil ke p dari suatu data adalah suatu nilai sehingga p persen data berada pada atau dibawah nilai tersebut dan (100 − p) persen data berada pada atau di atas nilai tersebut. Quartil adalah persentil yang membagi data menjadi empat. 1. Quartil pertama ditulis Q1 , adalah persentil ke 25 . 2. Quartil kedua ditulis Q2 , adalah median. 20 BAB 3. RINGKASAN DATA 3. Quartil ketiga ditulis Q3 adalah persentil ke 75. Prosedur mencari quartil: 1. Urutkan data dari nilai terkecil sampai dengan nilai terbesar 2. Posisi Q1 = 0.25(n + 1). 3. Posisi Q2 = 0.5(n + 1) 4. Posisi Q3 =0.75(n+1). Interquartil = Q3 − Q1 . Contoh 19. Data hasil ujian 40 mahasiswa 78 60 68 67 60 76 87 58 45 65 95 78 65 60 54 65 80 55 67 89 95 54 58 85 40 75 87 76 40 84 56 68 46 48 43 64 55 58 56 60 Setelah data diurutkan maka diperoleh : Posisi Q1 = 0.25(40 + 1) = 10.25. Q1 = = nilai ke 10 + 0.25( nilai ke 11 − nilai ke 10) 55 + 0.25 = 55.25. Posisi Q2 = 0.5(40 + 1) = 20.5 Q2 = = nilai ke 20 + nilai ke 21 2 64 + 65 = 64.5. 2 Posisi Q3 = 0.75(40 + 1) = 30.75 Q3 = = nilai ke 30 + 0.75( nilai ke 31 − nilai ke 30) 76 + 0.75(78 − 76) = 77.50. Interquartil=Q3 − Q1 = 77.50 − 55.25 = 22.5. 3.4. BOX PLOT 3.4 21 Box Plot Quartil bersama dengan nilai data terbesar dan terkecil menghasilkan ringkasan limabilangan dan sebaran data. Kelima bilangan yaitu: nilai data terkecil, Q1 , median, Q3 dan nilai data terbesar. Kelima bilangan dapat digunakan untuk membuat sketsa grafik data yang dinamakan box plot. Prosedur membuat box plot: 1. Gambarkan sebuah skala vertikal yang dapat mencakup nilai data terkecil dan nilai data terbesar. 2. Gambarkan sebuah kotak dari Q1 ke Q3 di sebelah kanan skala tersebut. 3. Berilah garis mendatar pada kotak tersebut di ketinggian median. 4. Gambarkan garis vertikal dari Q1 ke nilai data terkecil dan dari Q3 ke nilai data terbesar. Contoh 20. Grafik box-plot data hasil ujian 40 mahasiswa pada contoh terdauhulu. 22 3.5 BAB 3. RINGKASAN DATA Teorema Chebyshev Teorema 1. Diketahui x̄ dan s berturut-turut adalah mean sampel dan deviasi standar sampel dengan s > 0. Jika k ≥ 1 maka setidaknya 100(1 − 1/k 2 ) persen data berada di dalam interval x̄ − ks sampai dengan x̄ + ks. Contoh 21. Jika k = 2 maka setidaknya ada 100(1 − 1/22 ) = 100 · 3/4 = 75 persen data berada di dalam interval x̄ − 2s sampai dengan x̄ + 2s. Contoh 22. Nilai ujian 20 siswa adalah sebagai berikut: 5 7 6 8 6 5 4 8 9 9 7 8 5 4 6 7 6 8 Dari data tersebut diperoleh: x̄ = 6.55 dan s = 1.5035. Jika k = 3/2, maka setidaknya ada 6 7. 100(1 − 1/(3/2)2 ) = 100 · 5/9 = 55.55 3 1.5035 sampai dengan 6.55 + persen data berada di dalam interval 6.55 − 2 3 2 1.5035. Dengan kata lain setidaknya 55.55 persen data berada di dalam interval 4.29475 sampai dengan 8.8052. Dapat diperiksa bahwa nilai data yang berada di dalam interval tersebut adalah 5 7 6 8 6 5 8 7 8 8 6 7 6 8 7, yaitu ada 15 (lebih dari 55.55 persen) nilai data yang berada di dalam interval tersebut. Bab 4 Peluang 4.1 Ruang Sampel Suatu eksperimen dilaksanakan dengan tujuan untuk memperoleh hasil (outcome). Eksperimen random adalah suatu eksperimen yang dapat dilakukan berkali-kali pada kondisi yang sama dan hasilnya tidak dapat ditentukan dengan pasti sebelum eksperimen tersebut selesai. Ini berarti hasil yang akan terjadi dari suatu eksperimen random menganndung suatu ketidakpastian. Meskipun hasilnya tidak dengan secara pasti dapat ditentukan, namun kita masih dapat menentukan semua hasil yang mungkin terjadi. Definisi 6. Ruang sampel, ditulis S, dari suatu eksperimen random adalah himpunan semua hasil (outcome) yang mungkin terjadi. Definisi 7. Pertistiwa E adalah himpunan bagian dari ruang sampel S. Peristiwa E dikatakan terjadi, jika E memiliki anggota. Selanjutnya peristiwa akan dituliskan dangan huruf A, B, C, D, E, F dan sebagainya. Definisi 8. Peristiwa E ∩ F adalah peristiwa terjadinya E dan F . Peristiwa E c adalah peritstiwa tidak terjadinya E. Dua peristiwa E dan F dikatakan saling saling jika E ∩ F = ∅, yakni jika kedua peristiwa tidak memiliki anggota bersama. 23 24 BAB 4. PELUANG Definisi 9. Peristiwa elementer adalah peristiwa yang memiliki tepat satu anggota. Contoh 23. Suatu eksperimen random melontarkan dua mata uang logam satu kali. Peristiwa yang diamati adalah sisi yang menghadap ke atas. Jika sisi angka ditulis a dan sisi gambar ditulis g, maka ruang sampelnya adalah S = {aa, ag, ga, gg}. Jika E adalah peristiwa terjadinya sisi a tepat satu kali, maka dapat ditulis E = {ag, ga}. Jika F peristiwa terjadinya sisi gambar setidaknya satu kali, maka dapat ditulis F = {ag, ga, gg}. Peristiwa E ∩ F berarti peristiwa terjadi sisi angka sebanyak satu kali dan gambar satu kali, yaitu E ∩ F = {ag, ga}. Peristiwa E c menyatakan peristiwa tidak terjadinya E, yaitu tidak munculnya sisi angka sebanyak satu kali, dan dapat ditulis E c = {gg, aa}. Contoh 24. Sebuah dadu dilontarkan satu kali dan diamati banyaknya spot sisi yang menghadap ke atas. Ruang sampelnya dapat ditulis S = {1, 2, 3, 4, 5, 6}. Peristiwa elementernya adalah {1}, {2}, {3}, {4}, {5} dan {6}. Jika A peristiwa terjadinya sisi genap dan B peristiwa terjadinya sisi ganjil, A = {2, 4, 6} B = {1, 3, 5} maka A dan B merupakan peristiwa yang saling asing, karena A ∩ B = ∅. Contoh 25. Satu mata uang logam dilontarkan tiga kali. Ruang sampelnya adalah S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}. Jika E adalah peristiwa munculnya sisi angka paling banyak satu kali, maka dapat ditulis E = {agg, gag, gga, ggg}. 4.2. PELUANG 25 Jika F adalah peristiwa munculnya sisi gambar satu kali, maka dapat ditulis F = {aag, aga, gaa}. Peristiwa E ∪ F adalah peristiwa munculnya sisi angka paling banyak satu kali atau peristiwa munculnya sisi gambar dua kali. Jadi E ∪ F = {agg, gag, gga, ggg, aag, aga, gaa}. Contoh 26. Sebuah dadu dilontarkan dua kali. Pasangan (a, b) menyatakan sisi yang muncul pada lontaran a dan pada lontaran kedua b. Ruang sampelnya adalah S ={ (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Jika E peristiwa munculnya jumlah kedua lontaran 10, maka dapat ditulis E = {(4, 6), (5, 5), (6, 4)}. Jika F peristiwa munculnya lontaran pertama spot 4, maka dapat ditulis F = {(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)}. Contoh 27. Misalkan kita ingin meramalkan ketinggian sebuah roket yang ditembakan dari permukaan bumi. Ruang sampelnya adalah semua bilangan pada interval 0 sampai dengan tak hingga, S = {x : 0 ≤ x < takhingga}. Jadi ruang sampel ini memiliki tak hingga anggota. 4.2 Peluang Di dalam suatu percobaan random, akan terjadinya suatu peristiwa tidak dapat ditentukan secara pasti. Tingkat kepastian atau ketidakpastian ini diukur dengan suatu ukuran yang dinamakan peluang (probability). 26 BAB 4. PELUANG Definisi 10. (Pendekatan klasik peluang) Diketahui peristiwa E dapat terjadi dalam h cara berbeda dari seluruh n cara yang semuanya memiliki kemungkinan sama. Peluang peristiwa E, ditulis P (E), adalah P (E) = h . n Pengertian peluang secara klasik mengandung arti bahwa setiap peristiwa elementer memiliki peluang yang sama, yaitu sebesar N1 . Contoh 28. Sebuah mangkok berisi 5 bola merah dan 4 bola biru. Dari mangkok tersebut diambil tanpa pilih-pilih sebuah bola. Peluang terambilnya bola merah adalah 5 P (merah) = , 9 dan peluang terambilnya bola biru adalah P (biru) = 4 . 9 Definisi 11. (Pendekatan frekuensi) Jika setelah diulang n percobaan, dengan n besar, suatu peristiwa diketahui terjadi h kali, maka peluang peristiwa tersebut adalah h/n. Contoh 29. Jika satu mata uang logam dilontarkan 1000 kali dan diperoleh sisi gambar terjadi 512 kali, maka peluang terjadinya sisi gambar adalah 512/1000 = 0.512. Pada kenyataannya tidak semua peristiwa elementer memiliki peluang yang sama, misalnya peluang sebuah mesin jet macet tentu tidak sama dengan peluang mesin tersebut tidak macet. Oleh karena itu pengertian klasik peluang kurang tepat untuk berbagai fenomena yang terjadi sehari-hari. Perhatikan bahwa pada pengertian klasik, banyaknya anggota ruang sampel berhingga. Pada kenyataannya ada ruang sampel yang jumlah anggotanya tak hingga. Ini berarti pengertian klasik peluang tidak dapat digunakan jika banyaknya anggota ruang sampel tak hingga. Definisi 12. Diketahui S ruang sampel. Untuk setiap peristiwa E bagian S dihubungkan dengan suatu bilangan yang ditulis P (E) yang memenuhi sifatsifat berikut: 4.2. PELUANG 27 1. 0 ≤ P (E) ≤ 1. 2. P (S) = 1. 3. P (E1 ∪E2 ∪E3 ∪· · · ) = P (E1 )+P (E2 )+P (E3 )+· · · , dengan E1 , E2 , E3 , · · · adalah peristiwa yang saling asing. Jika P memenuhi ketiga sifat, maka P dinamakan peluang, dan P (E) dinamakan peluang terjadinya peristiwa E. Sifat (1) menyatakan bahwa peluang suatu peristiwa adalah suatu nilai numerik yang besarnya dari 0 hingga 1. Sifat (2) menyatakan bahwa perstiwa terjadinya ruang sampel adalah pasti. Sifat (3) menyatakan bahwa peluang gabungan peristiwa yang saling asing sama dengan jumlah peluang masing-masing peristiwa. Peluang merupakan ukuran numerik kemungkinan terjadinya suatu peristiwa. Nilai peluang yang mendekati satu berarti semakin besar kemungkinan persistiwa tersebut terjadi. Sebaliknya jika peluang suatu peristiwa pendekati nilai nol, berarti semakinkecil kemungkinan peristiwa tersebut terjadi. Jika suatu peristiwa memiliki peluang 1 artinya peristiwa tersebut pasti terjadi, sedangkan jika suatu peristiwa memiliki peluang 0 artinya peristiwa tersebut tidak mungkin terjadi. Contoh 30. Frekuensi relatif pada contoh merupakan peluang. Pada kolom tersebut nilai frekiensi relatif berada pada interval 0 hingga 1, jumlah semua frekuensi relatif adalah 1 dan frekuensi relatif gabungan kelas interval sama dengan jumlah frekuensi relatif kelas interval. Contoh 31. Tiga mata uang dilontarkan satu kali dan diamati sisi yang menghadap ke atas. Ruang sampelnya adalah S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}. Dianggap setiap peristiwa elementer memiliki peluang sama, yaitu 18 . Jika E menyatakan peristiwa terjadinya sisi angka satu kali dan F menyatakan peristiwa terjadinya sisi gambar paling sedikit dua kali, maka E dan F dapat dituliskan E = {agg, gga, gag} dan F = {ggg, gga, gag, agg}. P (E) = P (agg, gga, gag) = P (agg) + P (gga) + P (gag) = 81 + 18 + 18 = 83 . (4.1) 28 BAB 4. PELUANG P (F ) = P (ggg, gga, gag, agg) = P (ggg) + P (gga) + P (gag) + P (agg) = 18 + 81 + 18 + 81 = 12 . (4.2) Contoh 32. Sebuah mangkok berisi 10 kelereng merah, 30 kelereng putih, 25 kelereng biru dan 15 kelereng orange. Akan diambil satu kelereng. Berapa peluang terambilnya kelereng (a) putih (b) orange atau merah (c) bukan biru (d) merah, putih atau biru (e) bukan merah dan bukan biru Penyelesaian: Misalkan M, P, B dan O berturut-turut menyatakan kelereng warna merah, putih, biru dan orange. Banyaknya seluruh kelereng adalah 10 + 30 + 25 + 15 = 80. (a) P (P ) = 30 80 = 0.375. (b) P (O ∪ M ) = 15+10 80 = 0.3125. (c) P (B c ) = 1 − P (B) = 1 − (d) P (M ∪ P ∪ B) = 20 75 10+30+25 80 = 1 − 0.3125 = 0.6875. = 0.8125. (e) P (M c ∩ B c ) = P ((M ∪ B)c ) = 1 − P (M ∪ B) = 1 − 4.3 10+25 80 = 0.5625. Peluang Bersyarat Dalam suatu eksperimen random peluang terjadinya suatu peristiwa bisa tergantung terjadinya peristiwa lain. Sebagi contoh, peluang lahirnya anak kedua perempuan bisa tergantung apakah anak pertama laki-laki atau perempuan. Diketahui E dan F adalah peristiwa. Peluang terjadinya E jika diketahui peristiwa F telah terjadi dinamakan peluang bersyarat (conditional probability), dituliskan P (E|F ), dan didefinisikan P (E|F ) = P (E ∩ F ) . P (F ) Contoh 33. Sebuah mata uang logam dilontarkan dua kali, dan peluang setiap peristiwa elementer sama. Berapa peluang terjadinya sisi a pada lontaran kedua jika diketahui pada lontaran pertama sisi g telah terjadi? Misalkan E peristiwa terjadinya sisi a pada lontaran kedua dan F peristiwa 4.3. PELUANG BERSYARAT 29 terjadinya sisi g pada lontaran pertama. Jadi E = {aa, ga} dan F = {gg, ga}. Peluang yang dicari adalah P (E|F ) = P (E ∩ F ) P (ga) 1/4 1 = = = . P (F ) P (gg, ga) 2/4 2 Contoh 34. Suatu mangkok berisi tujuh bola hitam dan lima bola putih. Diambil dua bola dari dalam mangkok tersebut dan bola yang telah terambil tidak dikembalikan kedalam mangkok. Anggap setiap bola memiliki peluang sama untuk terambil. Berapa peluang bola yang terambil keduanya adalah bola hitam. Misalkan F dan E berturut-turut peristiwa bola pertama dan bola kedua adalah hitam. Karena bola pertama yang terambil hitam, maka ada enam bola hitam dan lima bola putih yang tersisa di dalam mangkok, dan dengan demikian P (E|F ) = Karena P (F ) = 7 12 , 6 . 11 maka peluang terambilnya kedua bola hitam adalah P (E ∩ F ) = P (F )P (E|F ) = 7 6 42 = . 12 11 132 Contoh 35. Pada suatu perguruan tinggi, s25 persen mahasiswa gagal matematika, 15 persen mahaasiswa gagal fisika, dan 10 persen maha siswa gagal matematika dan ilmu fisika. Seorang mahasiswa dipilih secara random. (a) Jika ia gagal fisika, berapa peluang ia gagal matematika? (b) Jika ia gagal matematika, berapa peluang ia gagal fisika? (c) Berapa peluang ia gagal matematika atau gagal fisika? Penyelesaian: Tuliskan M = peristiwa mahasiswa yang gagal matematika, F = persitiwa mahasiswa yang gagal fisika. Diperoleh P (M ) = 0.25, P (F ) = 0.15, P (M ∩ F ) = 0.10 (a) Peluang ia gagal matematika, diketahui ia gagal fisikaa adalah P (M |F ) = P (M ∩ F ) 0.10 2 = = P (F ) 0.15 3 (b) Peluang ia gagal fisika, diketahui ia gagal matematika adalah P (F ∩ M ) = P (F ∩ M ) 0.10 2 = = P (M ) 0.25 5 (c) Peluang ia gagal matematika atau gagal fisika adalah P (M ∪ F ) = P (M ) + P (F ) − P (M ∩ F ) = 0.25 + 0.15 − 0.10 = 0.30 30 BAB 4. PELUANG Peristiwa E dan F dikatakan independen, jika peluang terjadinya peristiwa E tidak tergantung apakah peristiwa F terjadi atau tidak terjadi. Dalam hal ini P (E|F ) = P (E) dan berlaku P (E ∩ F ) = P (E).P (F ). Jadi peristiwa E dan F independen jika peluang terjadinya kedua peristiwa bersamaan sama dengan hasil kali peluang terjadinya masing-masing peristiwa. Contoh 36. Satu mata uang logam dilontarkan dua kali. Jika E peristiwa munculnya sisi a pada lontaran pertama dan F peristiwa munculnya sisi g pada lontaran kedua, yaitu E = {aa, ag} dan F = {ag, gg}. Jika setiap peristiwa elementer memiliki peluang sama, maka P (E ∩ F ) = P (ag) = 1 4 1 1 1 · = , 2 2 4 sehingga P (∩F ) = P (E)P (F ), dengan kata lain E dan F adalah peristiwa yang independen. P (E)P (F ) = P (aa, ag)P (ag, gg) = Contoh 37. Dua dadu dilontarkan satu kali. A menyatakan peristiwa munculnya jumlah spot kedua sisi adalah enam dan B menyatakan peristiwa munculnya spot sisi dadu pertama empat. Diperoleh P (A ∩ B) = P ({4, 2}) = 1 36 dan 5 1 5 · = , 36 6 216 dan karena P (A ∩ B) 6= P (A)P (B), maka peristiwa A dan B tidak independen. P (A)P (B) = Peristiwa E1 , E2 , · · · , En dikatakan independen, jika untuk setiap r ≤ n berlaku P (E10 ∩ E20 ∩ · · · ∩ Er ) = P (E10 ) · P (E20 ) · · · P (Er ). Bab 5 Variabel Random Dalam suatu eksperimen random dapat terjadi peneliti tidak tertarik pada outcomenya tetapi barangkali lebih tertarik pada nilai numerik yang berkaitan dengan outcome tersebut. Misalnya dalam percobaan melontarkan tiga mata uang sekali, mungkin peneliti lebih tertarik untuk mengamati banyaknya suatu sisi terjadi dari pada mengamati sisi apa saja yang menghadap ke atas. Definisi 13. Variabel random adalah suatu fungsi yang domainnya ruang sampel dan nilainya bilangan real. Selanjutnya variabel random ditulis dengan notasi X. Jika c adalah peristiwa elementer, maka nilai variabel random X di c ditulis X(c). Jika nilai X(c) adalah x maka ditulis X(c) = x. Contoh 38. Dua mata uang logam dilontarkan satu kali. Jika X menyatakan banyaknya sisi a terjadi, maka X merupakan variabel random. Nilai variabel random pada setiap anggota ruang sampel adalah sebegai berikut: X(gg) = 0, 5.1 X(ag) = 1, X(ga) = 1, X(aa) = 2. Variabel Random Diskrit Variabel random X dikatakan variabel random diskrit jika nilai variabel random tersebut terhitung, yakni banyaknya nilai berhingga atau dapat dituliskan sebagai x1 , x2 , x3 , · · · . Pada Contoh 38, X merupakan variabel random diskrit. . 31 32 BAB 5. VARIABEL RANDOM Contoh 39. Tiga mata uang dilontarkan satu kali. Jika variabel random X menyatakan banyaknya sisi angka terjadi, maka nilai-nilai X adalah X(ggg) = 0 X(aaa) = 3 X(agg) = X(gag) = X(gga) = 1 X(aag) = X(aga) = X(gaa) = 2 Contoh 40. Dua dadu dilontarkan satu kali. Variabel random X menyatakan banyaknya jumlah bintik kedua sisi yang menghadap ke atas. Nilai-nilai variabel random X aadalah X((1, 1)) = 2 X((2, 1)) = 3 X((3, 1)) = 3 X((4, 1)) = 5 X((5, 1)) = 6 X((6, 1)) = 7 X((1, 2)) = 3 X((2, 2)) = 4 X((3, 2)) = 5 X((4, 2)) = 6 X((5, 2)) = 7 X((6, 2)) = 8 X((1, 3)) = 4 X((2, 3)) = 5 X((3, 3)) = 6 X((4, 3)) = 7 X((5, 3)) = 8 X((6, 3)) = 9 X((1, 4)) = 5 X((2, 4)) = 6 X((3, 4)) = 7 X((4, 4)) = 8 X((5, 4)) = 9 X((6, 4)) = 10 X((1, 5)) = 6 X((2, 5)) = 7 X((3, 5)) = 8 X((4, 5)) = 9 X((5, 5)) = 10 X((6, 5)) = 11 Jika X variabel random diskrit, maka peluang variabel random X bernilai x ditulis P (X = x). Pada Contoh 39 misalnya, variabel random X bernilai 2 jika dan hanya jika peristiwa {aag}, {aga} dan {gaa} terjadi. Ini berarti peluang X = 2 sama dengan peluang terjadinya peristiwa {aag, aga, gaa}, sehingga diperoleh P (X = 2) = P ({aag, aga, gaa}) = 3 . 8 Perhatikan bahwa nilai P (X = x) tergantung pada peristiwa yang dikaitkan dengan nilai variabel random x. Dengan demikian peluang variabel random X bergantung pada nilai x, dengan kata lain P (X = x) merupakan fungsi dari x. Oleh karena itu dapat dituliskan f (x) = P (X = x). Selanjutnya f (x) dinamakan fungsi peluang atau distribusi peluang variabel random X. Contoh 41. Pada Contoh 39, distribusi peluangnya adalah f (0) = P (X f (1) = P (X f (2) = P (X f (3) = P (X = 0) = P (ggg) = 81 = 1) = P (agg, gag, gga) = = 2) = P (aag, aga, gaa) = = 3) = P (aaa) = 18 3 8 3 8 X((1, 6)) = 7 X((2, 6)) = 8 X((3, 6)) = 9 X((4, 6)) = 10 X((5, 6)) = 11 X((6, 6)) = 12 5.1. VARIABEL RANDOM DISKRIT 33 Contoh 42. Pada Contoh 40, distribusi peluangnya adalah f (2) f (3) f (4) f (5) f (6) f (7) f (8) f (9) f (10) f (11) f (12) = P (X = P (X = P (X = P (X = P (X = P (X = P (X = P (X = P (X = P (X = P (X 1 = 2) = P ((1, 1)) = 36 2 = 3) = P ((1, 2)(2, 1)) = 36 3 = 4) = P ((1, 3), (2, 2), (3, 1)) = 36 4 = 5) = P ((1, 4), (2, 3), (3, 2), (4, 2)) = 36 5 = 6) = P ((1, 5), (2, 4), (3, 3), (4, 2), (5, 1)) = 36 = 7) = P ((1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) = 5 = 8) = P ((2, 6), (3, 5), (4, 4), (5, 3), (6, 2)) = 36 4 = 9) = P ((3, 6), (4, 5), (5, 4), (6, 3)) = 36 3 = 10) = P ((4, 6), (5, 5), (6, 4)) = 36 2 = 11) = P ((5, 6), (6, 5)) = 36 = 12) = P ((6, 6)) = 16 6 36 Fungsi distribusi kumulatif atau fungsi distribusi, ditulis F (x), adalah peluang variabel random X bernilai lebih kecil atau sama dengan x. Jadi F (x) = P (X ≤ x). Contoh 43. Perhatikan kembali Contoh 39. Distribusi kumulatifnya dalah F (0) = P (x ≤ 0) = P (X F (1) = P (x ≤ 1) = P (X F (2) = P (x ≤ 2) = P (X F (3) = P (x ≤ 3) = P (X = 0) = 81 = 0) + P (X = 1) = 12 = 0) + P (X = 1) + P (X = 2) = 78 = 0) + P (X = 1) + P (X = 2) + P (X = 3) = 1 34 BAB 5. VARIABEL RANDOM Contoh 44. Distribusi kumulatif pada Contoh 40 adalah F (2) F (3) F (4) F (5) F (6) F (7) = = = = = = = F (8) = P (x ≤ 2) = P (X P (x ≤ 3) = P (X P (x ≤ 4) = P (X P (x ≤ 5) = P (X P (x ≤ 6) = P (X 1 = 2) = 36 = 2) + P (X = 2) + P (X = 2) + P (X = 2) + P (X 3 = 3) = 36 6 = 3) + P (X = 4) = 36 = 3) + P (X = 4) + P (X = 5) = 10 36 = 3) + P (X = 4) + P (X = 5) + P (X = 6) 15 36 P (x ≤ 7) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) = 21 36 P (x ≤ 8) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) = 26 36 P (x ≤ 9) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) + P (X = 9) = 30 36 F (10) = P (x ≤ 10) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) = 33 36 F (11) = P (x ≤ 11) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) 35 +P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) = 36 F (12) = P (x ≤ 12) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) + P (X = 12) = 36 36 = 1. F (9) = 5.2. NILAI HARAPAN VARIABEL RANDOM DISKRIT 5.2 35 Nilai Harapan Variabel Random Diskrit Nilai harapan suatu variabel random menggambarkan nilai yang diharapkan akan terjadi dari suatu eksperimen random atau kecenderungan hasil yang akan terjadi. Definisi 14. Nilai harapan suatu variabel random diskrit ditulis E(X) atau µ, didefinisikan sebagai berikut X µ = E(X) = xi .P (X = xi ), Contoh 45. Pada percobaan melontarkan dua mata uang logam sebanyak satu kali (Contoh 38), diperoleh P (X = 0) = 1 4 P (X = 1) = 1 2 dan P (X = 2) = 1 . 4 Dengan demikian nilai harapannya adalah µ = E(X) = 0 · P (X = 0) + 1 · P (X = 1) + 2 · P (X = 2) = 0 · 14 + 1 · 12 + 2 · 14 = 1. Karena µ adalah nilai harapan variabel random X, maka X − µ merupakan deviasi X terhadap nilai harapannya. Ukuran yang menggambarkan variabilitas suatu variabel random didefinisikan berikut. Definisi 15. Varian variabel random diskrit X ditulis V ar(X) atau σ 2 adalah X σ 2 = V ar(X) = E((X − µ)2 ) = (xi − µ)2 .P (X = xi ), Kuantitas σ = √ σ 2 dinamakan deviasi standar. Berdasarkan definisi di atas, V ar(X) merupakan nilai harapan kuadrat deviasi X − µ; dengan demikian V ar(X) ≥ 0. Semakin besar varian suatu variabel random, semakin basar variabilitasnya. Nilai varian suatu variabel random adalah 0 jika dan hanya jika variabel random tersebut nilainya tetap. tersebut Contoh 46. Varian pada Contoh 38 di atas adalah σ 2 = V ar(X) = (0 − 1)2 .P (X = 0) + (1 − 1)2 .P (X = 1) + (2 − 1)2 .P (X = 2) = 41 + 0 + 2. 14 = 0.5. √ Deviasi standarnya adalah σ = 0.5 = 0.7. 36 5.3 BAB 5. VARIABEL RANDOM Variabel Random Kontinu Jika X adalah variabel random dengan peluang pada setiap titik tunggal x sama dengan nol, yakni P (X = x) = 0, maka X dinamakan variabel random kontinyu. Jika X variabel random kontinyu, maka ada fungsi f (x) sehingga peluang variabel random X berada di antara a dan b sama dengan luas daerah yang dibatasi oleh kurva f (x), sumbu x, garis x = a dan garis x = b. Selanjutnya peluang X berada di antara a dan b ditulis P (a < X < b). Fungsi f (x) tersebut dinamakan fungsi kepadatan peluang. Fungsi distribusi kumulatif variabel random kontinyu X, ditulis F (x), didefinisikan sebagai peluang variabel random X bernilai lebih kecil atau sama dengan x atau F (x) = P (X < x) Contoh 47. Diketahui variabel random kontinyu X memiliki fungsi densitas f (x) = 51 dengan 0 ≤ x ≤ 5. Peluang variabel random X berada antara 1 dan 3 adalah 2 P (1 ≤ X ≤ 3) = , 5 dan distribusi kumulatif di x = 2.5 adalah 1 F (2.5) = . 2 5.4 Variabel Random Bersama Di dalam suatu penelitian, kita sering tertarik pada dua variabel random atau lebih. Misalnya dalam meneliti tentang penyakit jantung, mungkin kita tertarik pada beberapa faktor penyebab seperti kebiasaan merokok dan konsumsi alkohol. Diketahui dua variabel random X dan Y . Untuk menggabungkan kedua variabel dapat kita gunakan fungsi distribusi kumulatif. Definisi 16. Diketahui variabel random X dan Y . Fungsi distribusi kumulatif bersama F (x, y) adalah F (x, y) = P (X ≤ x, Y ≤ y). Berdasarkan definisi di atas, fungsi distribusi kumulatif bersama adalah peluang variabel random X ≤ x dan Y ≤ y terjadi bersama-sama. Diketahui X dan Y masing-masing variabel random disktrit. Peluang variabel random X bernilai x dan variabel random Y bernilai y ditulis P (X = x, Y = y). Variabel random X dan Y dikatakan independen jika berlaku P (X = x, Y = y) = P (X = x).P (Y = y) 5.4. VARIABEL RANDOM BERSAMA 37 Dua variabel random kontinyu X dan Y dikatakan independent jika peluang terjadinya X tidak dipengaruhi apakah variabel random Y terjadi atau tidak. Jika f (x, y) fungsi densitas variabel random kontinyu X dan Y dan kedua variabel random independen, maka berlaku f (x, y) = f1 (x).f2 (y), dimana f1 (x) dan f2 (y) berturut-turut fungsi densitas X dan Y . 38 BAB 5. VARIABEL RANDOM Bab 6 Beberapa Distribusi Peluang Pada bagian ini akan disampaikan beberapa distribusi peluang variabel random diskrit dan kontinyu yang banyak digunakan didalam inferensi statistik. 6.1 Distribusi binomial Misalkan suatu eksperimen random hanya memiliki dua hasil yang mungkin, hasil pertama dinamakan sukses dan hasil kedua dinamakan gagal. Eksperimen tersebut diulang secara independen sebanyak n kali. Jika peluang sukses setiap eksperimen adalah sama sebesar p maka peluang gagal pada setiap eksperimen adalah p−1. Jika X menyatakan banyaknya sukses dari n percobaan (trial) dan peluang X = x diberikan oleh fungsi peluang berikut P (X = x) = n x p (1 − p)n−x , x x = 0, 1, 2, 3, · · · , n, (6.1) maka X dinamakan berdistribusi binomial dengan parameter n dan p. Selanjutnya dapat dibuktikan bahwa nilai harapan dan varians disrtibusi binomial adalah µ = np dan σ 2 = np(1 − p) (6.2) n Di dalam fungsi peluang binomial, notasi x menyatakan kombinasi x objek dari n objek, yaitu n n! = , (6.3) x x!(n − x)! dengan n! = 1 · 2 · 3 · · · (n − 1) · n dan 0! = 1. Contoh variabel random berdistribusi binomial adalah melontarkan mata uang logam, cacat tidaknya suatu produk dan macet tidaknya suatu mesin jet. 39 40 BAB 6. BEBERAPA DISTRIBUSI PELUANG Contoh 48. Diketahui suatu telur asin yang diproduksi suatu perusahaan memiliki peluang rusak 0.01 dan bersifat independen terhadap telor asin lainnya. Jika diambil secara random sampel sebanyak 5 telor asin, (a) berapa peluang telor asin yang rusak sebanyak satu? (b) berapa peluang telor asin yang rusak paling banyak satu? Jika X menyatakan banyaknya telor asin yang rusak, maka X merupakan variabel random binomial dengan n = 5 dan p = 0.01. Dengan demikian (a) Peluang telor asin yang rusak sebanyak satu adalah 5 P (X = 1) = (0.01)1 (1 − 0.01)4 = 0.04803. 1 (b) Peluang telor asin yang rusak paling banyak satu adalah P (X ≤ 1) 6.2 = P (X = 0) + P (X = 1) 5 5 0 5 = (0.01) (1 − 0.01) + (0.01)1 (1 − 0.01)4 0 1 = 0.95099 + 0.04803 = 0.99902. Distribusi Normal Variabel random X dikatakan berdistribusi normal dengan mean µ dan varian σ 2 jika fungsi densitasnya diberikan oleh f (x) = 2 2 1 √ e−(x−µ) /2σ , σ 2π (6.4) dengan π = 2, 1415... dan e = 2, 718282.... Contoh variabel random yang berdistribusi normal adalah diameter lubang yang dihasilkan mesin bor, skor suatu test, konsentrasi suatu bahan kimia pada suatu jenis obat, dan hasil panen pada suatu lahan. Jika mean µ = 0 dan deviasi σ = 1, maka X dinamakan berdistribusi normal standar. Grafik distribusi normal standar disajikan pada gambar 6.1, yakni berupa kurva yang simetris terhadap garis z = 0. Pada grafik ini sumbu horisontal z merupakan nilai variabel random dan sumbu vertikal merupakan nilai fungsi densitas f (z). Nilai maksimum grafik ini dicapai pada titik z = 0, semakin jauh dari titik z = 0 semakin kecil nilai fungsi ini dan akan mendekati nol jika nilai z mendekatai tak hingga atau mendekati minus tak hingga. Jika variabel random X berdistribusi normal standar, maka distribusi kumulatifnya dituliskan dengan notasi Φ(x); jadi Φ(x) = P (X ≤ x) (6.5) 6.2. DISTRIBUSI NORMAL 41 0.4 0.3 0.2 0.1 z −4 −2 2 4 Gambar 6.1: Kurva normal standar x Gambar 6.2: P (X ≤ x) = Φ(x) Secara grafik, kurva fungsi densitas normal standar simetris terhadap garis x = 0. Karena luas seluruhnya adalah 1, maka Φ(0) = 0.5. Luas daerah yang dibatasi oleh garis x = 0 dan x = a dengan luas daerah 42 BAB 6. BEBERAPA DISTRIBUSI PELUANG 0 Gambar 6.3: Φ(0) = 0.5 yang dibatasi x = 0 dan x = −a adalah sama. Dengan demikian berlaku Φ(−x) = 1 − Φ(x). −x x Gambar 6.4: Φ(−x) = 1 − Φ(x) Untuk menghitung peluang variabel random X yang berdistribusi normal standar dapat digunakan tabel normal standar. Peluang variabel random X berada di antara a dan b, dengan a < b, sama dengan luas daerah di bawah kurva normal yang dibatasi garis x = a dan x = b. Dengan demikian P (a ≤ X ≤ b) = Φ(b) − Φ(a). Contoh 49. Diketahui X berdistibusi normal standar. Hitunglah peluang (a) X lebih kecil 1.94, (b) X terletak antara 0.5 dan 1.4, (c) X berada antara −1.1 dan 1.5. (a) P (X < 1.94) = P (X ≤ 1.94) = Φ(1.94) = 0.9738. 6.3. DISTRIBUSI YANG BERHUBUNGAN DENGAN DISTRIBUSI NORMAL43 a b Gambar 6.5: P (a ≤ X ≤ b) = Φ(b) − Φ(a) (b) P (0.5 ≤ X ≤ 1.4) = Φ(1.4) − Φ(0.5) = 0.9192 − 0.6915 = 0.2277. (c) P (−1.1 ≤ X ≤ 1.5) = Φ(1.5) − Φ(−1.1) = Φ(1.5) − (1 − Φ(1.1)) = 0.9332 − (1 − 0.8643) = 0.7975. 6.3 6.3.1 Distribusi yang berhubungan dengan distribusi normal Distribusi Chi-Square Jika variabel random X1 , X2 , X3 , · · · , Xr adalah r variabel independen yang masing-masing berdistibusi normal standar, maka variabel random χ2 = X12 + X22 + X32 + · · · + Xr2 (6.6) berdistibusi dengan distribusi yang dinamakan distribusi Chi-square dengan derajat bebas r. Distribusi kumulatif χ2 dengan derajat bebas r ditulis P (χ2r ≤ x). Nilai batas x untuk derajat bebas r dan distribusi kumulatif γ tertentu dapat dicari pada suatu tabel yang dinamakan tabel Distribusi χ2 . Contoh 50. Carilah x sehingga P (χ212 ≤ x) = 0.05. Berdasarkan tabel dengan r = 12 dan γ = 0.05 diperoleh x = 5.226. 6.3.2 Distribusi t Diketahui Y dan Z variabel random independen, dengan Y berdistribusi normal standar dan Z berdistribusi chi-square dengan derajat bebas r. Dapat ditunjukan bahwa variabel random 44 BAB 6. BEBERAPA DISTRIBUSI PELUANG Y T =p Z/r (6.7) memiliki distribusi yang dinamakan distribusi t dengan derajat bebas r. Nilai distribusi kumulatif variabel random berditribusi t dengan derajat bebas r ditulis P (tr ≤ x). Nilai x untuk derajat bebas r dan distribusi kumulatif γ tertentu dapat dicari pada suatu tabel yang dinamakan tabel Distribusi t. Contoh 51. Carilah x sehingga P (t10 ≤ x) = 0.99. Berdasarkan tabel dengan r = 10 dan γ = 0.99 diperoleh x = 2.7638. 6.3.3 Distribusi F Diketahui variabel random X dan Y berdistribusi chi-square dengan derajat bebas berturut-turut r1 dan r2 . Dapat dibuktikan bahwa variabel random F = X/r1 Y /r2 (6.8) memiliki suatu distribusi yang dinamakan distribusi F dengan derajat bebas r1 dan r2 . Dalam hal ini r1 disebut juga derajat bebas pembilang dan r2 disebut juga derajat bebas penyebut. Distribusi kumulatif F dengan derajat bebas r1 dan r2 , ditulis P (Fr1 ,r2 ≤ x). Nilai x untuk r1 dan r2 tertentu dan distribusi kumulatif γ tertentu telah dihitung dan ditabelkan pada suatu tabel yang dinamakan tabel F . Contoh 52. Carilah x sehingga P (F4,10 ≤ x) = 0.95. Berdasarkan tabel dengan r1 = 4, r2 = 10 dan γ = 0.95 diperoleh x = 3.4780. Bab 7 Teori Sampling Di dalam aplikasi kita sering mengambil kesimpulan dari suatu kelompok individu atau populasi. Karena alasan tertentu, kita tidak mungkin untuk mengamati seluruh anggota populasi, namun hanya mengamati bagian dari populasi yang dinamakan sampel. Inferensi statistik adalah pengambilan kesimpulan berdasarkan sampel. Jika X variabel random dengan distribusi F dan dilakukan percobaan random sebanyak n kali, maka diperoleh variabel random X1 , X2 , · · · , Xn . Selanjutnya X1 , X2 , · · · , Xn dinamakan sampel random dari distribusi F . Suatu sampel dikatakan berukuran n jika banyaknya anggota sampel adalah n. Jika nilai sampel random tersebut berturut-turut adalah x1 , x2 , · · · , xn , maka nilainilai ini dinamakan nilai eksperimen atau data sampel. Suatu kuantitas yang dihitung dari data sampel dinamakan statistik, sedangkan suatu kauntitas yang dimiliki oleh suatu populasi dinamakan parameter. Dapat terjadi nilai parameter suatu populasi diketahui atau tidak diketahui. Contoh 53. Misalkan variabel random X menyatakan usia bola lampu yang diproduksi suatu perusahaan yang diasumsikan berdistribusi normal dengan mean µ dan varian σ 2 yang tidak diketahui. Satu-satunya cara untuk memperoleh informasi tentang µ dan σ 2 adalah dengan melakukan eksperimen random. Misalkan dilakukan eksperimen dengan mengambil secara random sebanyak n = 100 bola lampu, dan usia bola lampu yang tercatat adalah X1 , X2 , X3 , · · · , X100 . Dalam hal ini X1 , X2 , X3 , · · · , X100 merupakan sampel random yang berasal dari distribusi normal tersebut. Ke 100 bola lampu tersebut dapat digunakan untuk memperoleh informasi tentang µ dan σ 2 . Ukuran yang diperoleh dari ke 100 bola lampu tersebut merupakan statistik, sedangkan µ dan σ 2 merupakan parameter. Misalkan suatu populasi memiliki distribusi tertentu dengan mean populasi µ dan varian populasi σ 2 . Suatu sampel random X1 , X2 , · · · , Xn diambil dari populasi tersebut. Ada dua statistik yang penting, yaitu mean sampel dan 45 46 BAB 7. TEORI SAMPLING varian sampel. Definisi 17. Diketahui X1 , X2 , X3 , · · · , Xn adalah sampel random berukuran n. (a) Mean sampel didefinisikan n X= X Xi X1 + X2 + · · · + Xn = n n i=1 (b) Varian sampel didefinisikan S2 = n X (Xi − X)2 i=1 dan S = √ n−1 , S 2 dinamakan deviasi standar sampel. Contoh 54. Suatu eksperimen random telah dilakukan sebanyak 5 kali dan diperoleh X1 = 3.5, X2 = 3.2, X3 = 3.4, X4 = 3.3 dan X5 = 3.6. Mean sampelnya adalah X= 5 X Xi i=1 5 = 3.5 + 3.2 + 3.4 + 3.3 + 3.6 = 3.4, 5 dan varian sampelnya adalah S2 = 5 X (Xi − X)2 i=1 5−1 (3.5 − 3.4)2 + (3.2 − 3.4)2 + (3.4 − 3.4)2 + (3.3 − 3.4)2 + (3.6 − 3.4)2 4 = 0.025. √ Dengan demikian deviasi standar sampel adalah S = 0.025 = 0.158. = Distribusi sampel adalah distribusi peluang suatu statistik. Misalnya distribusi peluang X dinamakan distribusi sample mean. Teorema 2. Jika X1 , X2 , · · · , Xn sampel random berukuran n dari suatu distribusi dengan mean µ dan varian σ 2 , maka nilai harapan X dan varian X adalah 47 (a) E(X) = µ (b) V ar(X) = σ2 n . Berdasarkan teorema di atas, nilai harapan X sama dengan mean populasi µ, sedangkan varian X semakin mengecil dengan bertambahnya ukuran sampel n. Teorema 3 (Teorema Limit Pusat). Jika X adalah mean sampel random berukuran n dari suatu populasi dengan mean µ dan varian σ 2 , maka Z= X −µ √ σ n mendekati berdistribusi normal standar jika n besar. Umumnya Z mendekati distribusi normal untuk n ≥ 30. Teorema di atas dapat digunakan untuk mencari nilai pendekatan peluang variabel random X̄. Contoh 55. Suatu perusahan memproduksi bola lampu yang usia hidupnya berdistribusi mendekati normal dengan mean 800 jam dan deviasi standar 40 jam. Berapa peluang suatu sampel random sebanyak 16 bola lampu akar berusia rata-rata kurang dari 775 jam? √ Distribusi sampel X mendekati normal dengan µX = 800 dan σX = 40/ 16 = 10. Peluang yang dicari adalah 775 − 800 X −µ √ < P (X < 775) = P = P (Z < −2.5) = 0.0062. 10 σ n Teorema 4. Jika X1 , X2 , · · · , Xn sampel random berukuran n dari suatu dis2 Pn i −X) triibusi dengan mean µ dan varian σ 2 , maka nilai harapan S 2 = i=1 (Xn−1 adalah E(S 2 ) = σ 2 . Teorema tersebut menyatakan bahwa nilai harapan dari varian sampel sama dengan varian populasi. Brikutnya akan dibahas distribusi statistik suatu sampel random yang berasal dari populasi berdistrusi normal. Jika X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi normal dengan mean µ dan varian σ, dan mean 48 BAB 7. TEORI SAMPLING sampel X, maka Z= X −µ √ σ/ n berdistribusi normal standar. Teorema 5. Jika X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi normal dengan mean µ dan varian σ, maka (a) X dan S 2 independen (b) X berdistribusi normal dengan mean µ dan varian σ 2 /n (c) (n − 1)S 2 /σ 2 berdistribusi chi-square dengan derajat bebas n − 1. Di dalam inferensi statistik, sering diasumsikan bahwa sampel random X1 , X2 , · · · , Xn bersifat independen. Jika ukuran populai berhingga, maka tidak ada jaminan sampel random tersebut independen. Namun jika ukuran populasi relatif besar terhadap ukuran sampel, maka sampel random tersebut mendekati independen. Bab 8 Estimasi Jika kita telah memperoleh data sampel dari suatu populasi yang memiliki mean µ yang tidak diketahui, maka untuk memperoleh informasi tentang parameter µ dapat digunakan mean sampel x̄. Ini berarti statistik x̄ digunakan untuk mengestimasi (meduga) parameter mean populasi µ. Dalam hal ini x̄ dinamakan estimator (penduga) untuk µ. Secara umum, jika θ parameter populasi, maka estimator untuk θ ditulis θ̂. Jadi µ̂ = x̄. Estimator titik suatu parameter adalah estimator yang berupa sebuah nilai tunggal. Sebagai contoh, dalam pernyataan ”rata-rata hasil pengukuran kecepatan cahaya adalah 301.000 km/detik”, nilai tersebut adalah suatu estimator titik. Definisi 18. Suatu statistik dikatakan estimator tak bias parameter θ jika nilai harapannya sama dengan θ. Jika tidak demikian maka statisik tersebut dikatakan bias. Pada kuliah sebelumnya telah disampaikan bahwa statistik Pn X= i=1 Xi n memiliki nilai harapan sama dengan mean populasi µ. Dengan demikian X merupakan estimator tak bias untuk parameter µ . Demikian pula varian sampel S2 = Pn − X)2 n−1 i=1 (Xi juga merupakan estimator tak bias parameter varian σ 2 . 49 50 BAB 8. ESTIMASI Definisi 19. Suatu estimator θ1 dikatakan lebih efisien dari pada estimator θ2 jika varian θ1 lebih kecil dibanding varian θ2 . Suatu estimator yang berupa interval dimana parameter diduga berada dinamakan estimator interval. Sebagai contoh, jika dikatakan kecepatan cahaya berkisar antara 299.000 km/detik sampai dengan 305.000 km/detik, maka nilai kecepatan cahaya yang sebenarnya dipercaya berada di antara kedua batas interval. Interval kepercayaan untuk suatu parameter adalah suatu inteval dalam mana parameter dipercaya berada. Misalkan θ adalah parameter yang tidak diketahui. Untuk membentuk interval kepercayaan θ, kita perlu mencari statistik U dan L sehingga peluang P (L ≤ θ ≤ U ) = 1 − α adalah benar. Interval L≤θ≤U (8.1) dinamakan interval kepercayaan 100(1-α) persen untuk parameter θ. Interval kepercayaan dapat diinterpretasikan sebagai berikut: jika kita mengambil sampel random berulang-ulang, maka 100(1−α) persen dari semua nilai data akan memuat nilai θ yang sebenarnya. Di dalam persamaan 8.1, L dan U berturut-turut dinamakan batas bawah dan batas atas interval. Jika α = 0.05 misalnya, maka persamaan 8.1 dinamakan interval kepercayaan 95 persen untuk θ. Pada bagian berikut, kita akan belajar membentuk interval kepercayaan untuk paramter mean populasi µ, varian populasi σ 2 dan selisih dua mean populasi. 8.1 Interval Kepercayaan untuk µ dengan σ Diketahui Misalkan X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi normal dengan mean µ dan varian σ 2 . Telah disampaikan bahwa X merupakan estimator µ. Namun demikian kita tidak dapat memastikan bahwa X = µ, melainkan kita hanya dapat menyatakan bahwa µ berada di dalam interval tertentu. Karena X berdistribusi normal dengan mean µ dan varian σ 2 /n, maka X −µ √ σ/ n 8.1. INTERVAL KEPERCAYAAN UNTUK µ DENGAN σ DIKETAHUI 51 berdistribusi normal standar. Oleh karena itu √ (X − µ) < 1.96 = 0.95 P −1.96 < n σ atau ekivalen dengan σ σ P X − 1.96 √ < µ < X + 1.96 √ = 0.95 n n Interval σ σ X − 1.96 √ , X + 1.96 √ n n dinamakan interval kepercayaan 95 persen untuk µ. Jika x1 , x2 , · · · , xn adalah data sampel dari distribusi di atas, dan x adalah rata-rata sampel, maka interval kepercayaan 95 persen untuk µ adalah σ σ x − 1.96 √ , x + 1.96 √ . n n Contoh 56. Dari data sampel random berat badan 100 orang dewasa di Palangkaraya diperoleh x = 67.45 kg dan penelitian sebelumnya menyatakan bahwa σ 2 = 8.6136 kg. Carilasolh interval kepercayaan 95 persen berat badan orang dewasa di Palangkaraya. Penyelesaian. Berdasarkan yang diketahui, interval kepercayaan 95 persen untuk mean populasi adalah 2.93 √ = 67.45 − 1.96 √2.93 x − 1.96 √σn , x + 1.96 √σn , 67.45 + 1.96 100 100 = (66.8748, 68.0252) . Ini berarti 95 persen dapat dipercaya bahwa berat badan rata-rata orang dewasa di Palangkaraya berada di antara (66.8748 kg sampai dengan 68.0252 kg. Dengan cara yang serupa, interval kepercayaan 99 persen untuk mean populasi µ adalah σ σ X − 2.58 √ , X + 2.58 √ . n n Secara umum, interval kepercayaan (1 − α) persen untuk mean populasi µ jika σ diketahui adalah σ σ X − zα/2 √ , X + zα/2 √ . n n Nilai zα/2 untuk beberapa tingkat kepercayaan yang sering digunakan adalah 52 BAB 8. ESTIMASI Tingkat kepercayaan zα/2 99.73 % 99 % 98 % 96 % 95.45 % 95 % 90 % 3.00 2.58 2.33 2.05 2.00 1.96 1.645 Table 8.1: Tabel zα/2 8.2 Interval Kepercayaan untuk µ dengan σ Tidak Diketahui Misalkan X1 , X2 , · · · , Xn sampel random dari populasi berdistribusi normal dengan µ dan σ 2 keduanya tak diketahui. Dapat dibuktikan bahwa √ (X − µ) n S berdistribusi t dengan derajat bebas n − 1. Interval kepercayaan (1 − α) persen untuk µ dapat dibentuk sebagai berikut. √ (X − µ) n P −tα/2,n−1 < < tα/2,n−1 = 1 − α S atau ekivalen dengan S S √ √ < µ < X + tα/2,n−1 = 1 − α. P X − tα/2,n−1 n n Jadi jika X = x dan S = s, maka kita dapat menyatakan bahwa 100(1 − α) persen percaya nilai µ berada di dalam interval S S . x − tα/2,n−1 √ , x + tα/2,n−1 √ n n Contoh 57. Berdasarkan data sampel random pengukuran 10 diameter pipa menghasilkan mean x = 2.38 cm dan deviasi standar s = 0.06 cm. Carilah interval kepercayaan 95 persen untuk diameter pipa yang sebenarnya. Penyelesaian. Berdasarkan tabel t dengan α = 0.05 dan n = 10 diperoleh t0.025,9 = 2.262. Interval kepercayaan 95 persen untuk diameter pipa yang sebenarnya adalah 0.06 0.06 √ , 2.38 + 2.262 2.38 − 2.262 √ 10 10 = (2.38 − 0.04292, 2.38 + 0.04292) = (2.3371, 2.4229) yang berarti bahwa 95 persen dapat dipercaya diameter pipa yang sebenarnya antara 2.3371 dan2.4229. 8.3. INTERVAL KEPERCAYAAN UNTUK σ 2 8.3 53 Interval Kepercayaan untuk σ 2 Diketahui X1 , X2 , · · · , Xn sampel random dari populasi berdistribusi normal dengan mean µ dan varian σ 2 yang tidak diketahui. Dapat dibuktikan bahwa (n − 1) S2 σ2 berdistribusi Chi-square dengan dejarat bebas n − 1. Interval kepercayaan (1 − α) persen untuk σ 2 dapat dibentuk sebagai berikut. S2 2 2 P χ1−α/2,n−1 < (n − 1) 2 < χα/2,n−1 = 1 − α σ atau ekivalen dengan P (n − 1)S 2 (n − 1)S 2 < σ2 < 2 2 χα/2,n−1 χ1−α/2,n−1 ! = 1 − α. Jadi jika S 2 = s2 , interval kepercayaan 100(1 − α) persen untuk σ 2 adalah ! (n − 1)S 2 (n − 1)S 2 , . χ2α/2,n−1 χ21−α/2,n−1 Contoh 58. Kapasitas 10 batere diukur dan hasilnya sebagai berikut (dalam ampere − jam): 140, 136, 150, 144, 148, 152, 138, 141, 143, 151. (a) Carilah estimasi untuk varian populasi σ 2 , dan (b) hitunglah interval kepercayaan 99 persen untuk σ 2 . Penyelesaian. (a) Dari data tersebut diperoleh x = 144.3. Estimasi untuk varian populasi 10 X (Xi − 144.4)2 S2 = = 32.23. 10 − 1 i=1 (b) Karena 1 − α = 0.99 maka α/2 = 0.01/2 = 0.005. Berdasarkan tabel Chi-square diperoleh χ20.005,9 = 23.589 dan χ21−0.005,9 = χ20.995,9 = 1.735. Jadi interval kepercayaan 99 persen untuk σ 2 adalah (n − 1)S 2 (n − 1)S 2 , χ2α/2,n−1 χ21−α/2,n−1 ! = 9 × 32.23 9 × 32.23 , 23.589 1.735 = (12.30, 167.19), yang berarti bahwa dapat dipercaya 99 persen nilai varian populasi berada pada interval (12.30, 167.19). 54 BAB 8. ESTIMASI 8.4 Interval Kepercayaan Selisih Dua Mean Dalam suatu penelitian mungkin kita ingin membentuk interval kepercayaan selisih dua mean populasi. Misalkan X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi normal dengan mean µ1 dan varian σ12 , dan Y1 , Y2 , · · · , Ym adalah sampel random dari populasi berdistribusi normal dengan mean µ2 dan varian σ22 . Kita akan membentuk interval kepercayaan selisih kedua mean populasi, yaitu µ1 − µ2 . Dari pembahasan sebelumnya X̄ berdistribusi normal dengan mean µ1 dan varian σ12 /n; dan Ȳ berdistribusi normal dengan mean µ2 dan varian σ22 /m. Oleh karena itu X̄ − Ȳ berdistribusi normal dengan mean µ1 − µ2 dan varian σ12 /n + σ22 /m. Pembahasan akan dibagi menjadi dua, yaitu jika σ12 dan σ22 diketahui dan tidak diketahui. Jika σ12 dan σ22 diketahui, maka X̄ − Ȳ − (µ1 − µ2 ) q σ12 σ22 n + m berdistribusi normal standar. Dengan demikian interval kepercayaan 100(1-α) persen untuk µ1 − µ2 adalah ! r r σ22 σ22 σ12 σ12 x̄ − ȳ − zα/2 + , x̄ − ȳ + zα/2 + n m n m Contoh 59. Hasil pengamatan IQ yang diambil dari dua populasi anak yang tinggal di perkotaan (A) dan di pedesaan (B) adalah sebagai berikut Jika dikeSampel A : Sampel B : 100 121 104 101 108 120 99 98 115 99 120 104 103 104 112 107 124 111 120 123 110 tahui varians IQ anak-anak di perkotaan dan pedesaan berturut-turut adalah 7, 02 dan 6, 8, carilah interval kepercayaan 90 persen selisih rata-rata kedua kelompok anak. Penyelesaian. Diketahui n1 = 11, n2 = 10, σ12 = 7.02 dan σ22 = 6.8. Dapat dihitung bahwa x̄1 = 110.45 x̄2 = 108.8 Karena zα/2 = z0.05 = 1.645, maka interval kepercayaan 90 persen untuk µ1 −µ2 adalah q q 6.8 7.02 6.8 110.45 − 108.8 − (1.645) 7.02 + , 110.45 − 108.8 + (1.645) = (−0.24, 3.54) 11 10 11 + 10 yang berarti bahwa 90 persen dapat dipercaya seleisih IQ anak di perkotaan dan di pedesaan berada pada interval −0.24 sampai dengan 3.54. 8.4. INTERVAL KEPERCAYAAN SELISIH DUA MEAN 55 Jika varian kedua populasi tidak diketahui, namun nilainya sama, maka kita dapat menggunakan varian sampel, P P 1 1 2 2 s2x = n−1 s2y = m−1 i (xi − x̄) i (yi − ȳ) (8.2) (n−1)s2x +(m−1)s2y s2p = n+m−2 dan interval kepercayaan 100(1 − α) persen untuk µ1 − µ2 adalah p p x̄ − ȳ − tα/2, n+m−2 sp 1/n + 1/m, (x̄ − ȳ + tα/2, n+m−2 sp 1/n + 1/m (8.3) Contoh 60. Jika varian kedua populasi pada contoh 59 tidak diketahui tetapi dianggap sama, carilah interval kepercayaan 90 persen untuk beda mean kedua populasi. Penyelesaian. Misalkan X dan Y berturut-turut menyatakan variabel random IQ anak perkotaan dan anak pedesaan. Berdasarkan data diatas, n = 11 dan m = 10. Selanjutnya dapat dihitung bahwa x̄ = 110.45 s2x = 73.2727 ȳ = 108.8 s2y = 89.2889 (10)(73.2727 + (9)(89.2889) = 80.8593, sp = 8.9923 19 Berdasarkan tabel, nilai tα/2, n+m−2 = t0.05, 19 = 1.729. Oleh karena itu interval 90 persen untuk µ1 − µ2 adalah p p 110.45 − 108.8 − (1.729)(8.9923) 1/10 + 1/9, 110.45 + 108.8 − (1.729)(8.9923) 1/10 + 1/9 = (1.65 − 7.1437, 1.65 + 7.1437) = (−5.4937, 8.7937) s2p = Ini berarti dapat dipercaya 90 persen bahwa selisih mean IQ antara anak perkotaan dan anak pedesaan berada di antara -5.4937 dan 8.7937. 56 BAB 8. ESTIMASI Bab 9 Uji Hipotesis Dalam penerapan kita sering menyatakan suatu sifat populasi berdasarkan informasi sampel. Suatu pernyataan atau klaim tentang parameter populasi dinamakan hipotesis statistik. Dinamakan hipotesis statistik karena pernyataan tersebut bisa benar atau bisa tidak benar. Definisi 20. Uji hipotesis adalah suatu aturan dimana setelah data sampel diperoleh maka akan menuntun kepada diterima atau ditolaknya suatu hipotesis. Suatu hipotesis yang akan diuji dinamakan hipotesis nol, ditulis H0 . Hipotesis yang berbeda dengan hipotesis nol dinamakan hipotesis alternatif, ditulis H1 . Suatu hipotesis yang jika benar maka menggambarkan secara lengkap distribusi populasi, dinamakan hipotesis sederhana. Jika tidak demikian maka dinamakan hipotesis komposit. Sebagai contoh tinjau dua hipotesis berikut. (a) Rata-rata berat badan mahasiswa UM Palangkaraya adalah µ = 60 (b) Rata-rata berat badan mahasiswa UM Palangkaraya adalah µ ≤ 60 Hipotesis (a) merupakan hipotesis sederhana, sedangkan hipotesis (b) merupakan hipotesis komposit. Perhatikan bahwa jika hipotesis (a) benar, maka nilai parameter populasi secara tegas dinyatakan dengan µ = 1; sebaliknya pada hipoteis (b) jika benar maka nilai parameter populasi µ tidak dapat tergambar secara tegas. Contoh 61. Kita klaim bahwa rata-rata berat badan mahasiswa UM Palangkaraya adalah 60 kg. Untuk membuktikan benar atau tidaknya klaim tersebut, maka perlu diuji. Dalam hal ini hipotesis nolnya adalah ”rata-rata berat badan mahasiswa UM Palangkaraya adalah 60 kg”. Hipotesis alternatifnya misalnya adalah ”rata-rata berat badan mahasiswa UM Palangkaraya tidak sama dengan 60 kg”. 57 58 BAB 9. UJI HIPOTESIS Hipotesis alternatif lainnya misalnya adalah ”rata-rata berat badan mahasiswa UM Palangkaraya adalah kurang dari 60 kg”. Perhatikan kembali contoh 61. Jika hipotesis nolnya adalah ”rata-rata berat badan mahasiswa UM Palangkaraya adalah 60 kg” dan hipotsis alternatifnya adalah ”rata-rata berat badan mahasiswa UM Palangkaraya tidak sama dengan 60 kg”, maka kita dituliskan H0 : µ = 60 H1 : µ 6= 60. melawan hipotesis Karena H0 dan H1 merupakan pernyataan yang komplementer, maka mudah dipahami bahwa jika kita menerima H0 tentu kita tidak menerima H1 atau menolak H1 . Demikian pula jika kita menolak H0 berarti kita menerima H1 . Karena data yang digunakan untuk menerima atau menolak suatu hipotesis adalah data sampel, maka kita tidak dapat memastikan apakah hipotesisi tersebut benar atau salah. Dalam pengambilan kesimpulan, kalaupun ada kesalahan tentu kita berharap kesalahan tersebut sekecil mungkin. Menolak suatu pernyataan yang benar tentu merupakan suatu kesalahan. Demikian pula, menerima suatu pernyataan yang salah tentu merupakan suatu kesalahan. Definisi 21. Kesalahan jenis I adalah ditolaknya H0 padahal H0 benar. Kesalahan jenis II adalah diterimanya H0 padahal H0 salah. Definisi 22. Tingkat signifikansi suatu uji hipotesis, ditulis α, adalah peluang terjadinya kesalahan jenis I. 9.1 9.1.1 Uji tentang mean populasi normal Uji hipotesis dengan σ 2 diketahui Diketahui X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi normal dengan mean µ dan varian σ 2 yang diketahui. Misalkan kita akan menguji hipotesis H0 : µ = µ0 melawan hipotesis H1 : µ 6= µ0 9.1. UJI TENTANG MEAN POPULASI NORMAL 59 dimana µ0 suatu konstanta. Pn Xi Karena X = i=1 n adalah estimator untuk µ, maka cukup beralasan bahwa kita menerima H0 jika X tidak berbeda jauh dengan µ0 . Karena X berdistribusi normal dengan mean µ dan varian σ 2 /n, maka H0 benar asalkan Z= X − µ0 √ σ/ n berdistribusi normal standar. Aturan 1. Untuk menguji hipotesis H0 : µ = µ0 melawan hipotesis H1 : µ 6= µ0 digunakan aturan √ terima H0 jika tolak H0 jika n X − µ0 ≤ zα/2 √σ n z= X − µ0 > zα/2 σ z= Contoh 62. Akan diuji suatu pernyataan bahwa rata-rata jumlah anak per KK di Palangkaraya adalah 3. Diambil sampel random berukuran 100 dan diperoleh rata-rata sampel x = 2.84. Jika diketahui σ = 0.8 akan diuji hipotesis tersebut pada tingkat signifikansi α = 0.05. Dalam hal ini hipotesis yang akan diuji H0 : µ = 3 melawan hipotesis H1 : µ 6= 3 Penyelesaian Berdasarkan tabel normal standar, zα/2 = z0.025 = 1.96. Diperoleh √ √ n 100 z= X − µ0 = |2.84 − 3| = 2.0. σ 0.8 Karena z > z0.025 ini berarti H0 ditolak dan disimpulkan bahwa rata-rata banyaknya anak per KK di Palangkaraya tidak sama dengan 3. Dapat terjadi H0 : µ ≤ µ0 dan hipotesis alternatifnya adalah H1 : µ > µ0 . Untuk menguji hipotesis demikian kita gunakan aturan berikut. 60 BAB 9. UJI HIPOTESIS Aturan 2. Untuk menguji hipotesis: H0 : µ ≤ µ0 melawan hipotesis H1 : µ > µ 0 digunakan aturan √ n X − µ0 ≤ zα √σ n X − µ0 > zα tolak H0 jika z = σ Uji hipotesis demikian dinamakan uji hipotesis satu sisi. terima H0 jika z= Demikian pula dapat terjadi H0 : µ ≥ µ0 dan hipotesis alternatifnya adalah H1 : µ < µ0 . Aturan 3. Untuk menguji hipotesis: H0 : µ ≥ µ0 melawan hipotesis H1 : µ < µ 0 digunakan aturan √ n X − µ0 ≥ −zα √σ n X − µ0 < −zα tolak H0 jika z = σ Contoh 63. Semua rokok yang beredar di pasaran mengandung nikotin paling sedikit 1.6 mg per batang rokok. Suatu perusahaan rokok mengklaim dengan suatu metode tertentu dapat menurunkan kadar nikotin kurang dari 1.6 mg per batang rokok. Untuk menguji klaim tersebut, sampel berukuran 20 dari perusahaan tersebut dianalisis. Diketahui devisi standar nikotin pada rokok adalah 0.8 mg. Jika rata-rata nikotin ke 20 rokok pada sampel tersebut adalah 1.54, apakah klaim perusahaan tersebut dapat diterima pada tingkat signifikansi 5 persen? terima H0 jika z= Penyelesaian Akan diuji hipotesis H0 : µ ≥ 1.6 melawan H1 : µ < 1.6. Berdasarkan tabel normal diperoleh z−α = z−0.05 = −1.65. Berdasarkan data di atas diperoleh √ √ n 20 z= X − µ0 = (1.54 − 1.6) = −0.336. σ 0.8 Karena z ≥ z−0.05 maka H0 diterima, yang berarti klaim perusahaan tersebut tidak benar pada tingkat signifikansi 5 persen. 9.1. UJI TENTANG MEAN POPULASI NORMAL 9.1.2 61 Uji hipotesis dengan σ 2 tidak diketahui Dalam situasi yang lebih umum, mean populasi µ dan varian populasi σ 2 biasanya tidak diketahui. Aturan 4. Untuk menguji hipotesis H0 : µ = µ0 melawan hipotesis H1 : µ 6= µ0 digunakan aturan √ terima H0 jika tolak H0 jika n X − µ0 ≤ tα/2,n−1 √S n t= X − µ0 > tα/2,n−1 S t= dimana S 2 adalah varian sampel dan n ukuran sampel. Contoh 64. Pemerintah mengklaim bahwa kebutuhan air bersih rata-rata rumah tangga adalah 350 galon per hari. Untuk membuktikan klaim tersebut, suatu studi terhadap 20 rumah tangga dilaksanakan dan diperoleh data 340 356 332 362 318 344 386 402 322 360 362 354 340 372 338 375 364 355 324 370 Berdasarkan data sampel tersebut, apakah klaim pemerintah dapat diterima pada tingkat signifikansi 10 persen? Penyelesaian Akan diuji hipotesis H0 : µ = 350 melawan H1 : µ 6= 350. Berdasarkan data tersebut diperoleh X = 353.8 dan S = 21.8478. Dengan demikian √ n 20 t= X − µ0 = |353.8 − 350| = 0.7778 S 21.8478 √ Berdasarkan tabel t diperoleh tα/2,n−1 = t0.05,19 = 1.729. Karena t < t0.05,19 berarti H0 diterima, yang berarti bahwa klaim pemerintah dapat diterima dengan tingkat signifikansi 10 persen. 62 BAB 9. UJI HIPOTESIS Aturan 5. Uji hipotesis satu sisi: H0 : µ ≤ µ0 melawan hipotesis H1 : µ > µ 0 digunakan aturan √ terima H0 jika tolak H0 jika n X − µ0 ≤ tα,n−1 S √ n t= X − µ0 > tα,n−1 S t= dimana S 2 adalah varian sampel dan n ukuran sampel. Demikian pula uji hipotesis satu sisi: Aturan 6. H0 : µ ≥ µ0 melawan hipotesis H1 : µ < µ 0 digunakan aturan √ terima H0 jika tolak H0 jika n X − µ0 ≥ −tα,n−1 √S n t= X − µ0 < −tα,n−1 S t= dimana S 2 adalah varian sampel dan n ukuran sampel. 9.2 Uji kesamaan mean dua populasi Jika kita ingin mengetahui efek suatu jenis obat dalam menyembuhkan suatu penyakit, maka setidaknya kita mencoba obat tersebut ke suatu sampel dan membandingkan hasilnya dengan sampel lain yang tidak diberi obat, yakni kita memiliki dua sampel yang mendapat perlakuan berbeda. Untuk mengetahui apakah suatu metode belajar tertentu memberikan hasil yang berbeda dengan metode belajar yang ada, tentu kita harus mencobakan metode tertentu tersebut dan membandingkan hasilnya dengan metode yang ada. Pada kedua contoh, yang akan kita selidiki dapat berupa kesamaan/perbedaan mean kedua populasi. 9.2. UJI KESAMAAN MEAN DUA POPULASI 9.2.1 63 Varian populasi diketahui Misalkan X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym adalah dua sampel independen dari dua populasi yang berdistribusi normal, yang masing-masing memiliki mean µx dan µy yang tidak diketahui, dan varian σx2 dan σy2 yang diketahui. Andaikan akan diuji hipotesis H0 : µx = µy melawan hipotesis H1 : µx 6= µy Karena X adalah estimator µx dan Y adalah estimator µy , maka X − Y dapat digunakan untuk mengestimasi µx − µy . Karena H0 dapat ditulis H0 : µx − µy = 0, maka cukup beralasan untuk menerima H0 bilamana X − Y tidak berbeda jauh dengan 0. Karena X − Y berdistribusi normal dengan mean µx − µy dan varian σx2 /n + σy2 /m, maka (X − Y ) − (µx − µy ) q 2 σy2 σx n + m berdistribusi normal standar.Ini berakibat jika H0 benar, yakni µx − µy = 0, maka X −Y q 2 σy2 σx n + m berdistribusi normal standar. Dengan demikian belaku P −zα/2 X −Y ≤q ≤ zα/s = 1 − α. 2 σy2 σx n + m Aturan 7. Untuk menguji H0 : µx = µy melawan hipotesis H1 : µx 6= µy dengan tingkat signifikansi α digunakan aturan terima H0 jika tolak H0 jika X − Y z=q ≤ zα/2 2 σy2 σx + n m X − Y > zα/2 . z=q 2 σy2 σx + n m 64 9.2.2 BAB 9. UJI HIPOTESIS Varian populasi tidak diketahui Misalkan X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym adalah dua sampel independen dari dua populasi yang berdistribusi normal, yang masing-masing memiliki mean µx dan µy yang tidak diketahui, dan varian σx2 dan σy2 juga tidak diketahui. Lebih lanjut dimisalkan σx2 = σy2 = σ 2 . Andaikan akan diuji hipotesis H0 : µx = µy melawan hipotesis H1 : µx 6= µy Kita akan menerima H0 jika X − Y tidak berbeda jauh dengan 0. Varian masing-masing sampel adalah Pn (Xi − X)2 Sx2 = i=1 n−1 Pm (Yi − Y )2 Sy2 = i=1 . m−1 Dapat ditunjukan bahwa X − Y − (µx − µy ) q 1 Sp2 n1 + m berdistibusi t dengan dejarat bebas n + m − 2, dimana Sp2 = (n − 1)Sx2 + (m − 1)Sy2 . n+m−2 Oleh karen itu jika H0 benar, yakni jika µx − µy = 0, maka statistik t= q X −Y Sp2 1 n + 1 m berdistribusi t dengan dejarat bebas n + m − 2. Aturan 8. (σx2 dan σy2 sama dan tidak diketahui) Untuk menguji H0 : µx = µy melawan hipotesis H1 : µx 6= µy dengan tingkat signifikansi α digunakan aturan terima tolak H0 H0 jika jika |t| = q |t| = q |X − Y | Sp2 1 n + 1 m |X − Y | Sp2 1 n + 1 m ≥ tα/2,n+m−2 > tα/2,n+m−2 9.2. UJI KESAMAAN MEAN DUA POPULASI 65 Contoh 65. Dua puluh lima pria sebuah institusi dipilih secara random dan diamati tekanan darah sistoliknya. Dari 25 pria tersebut tercatat 11 perokok dan 14 bukan perokok, dan hasil pengamatan tekanan tersebut adalah sebagai berikut: Perokok 124 134 136 125 133 127 135 131 133 125 118 Bukan perokok 120 130 122 128 129 118 122 116 127 135 120 122 120 115 123 Apakah ada perbedaan rata-rata tekanan darah sistolik antara perokok dan bukan perokok pada tingkat signifinasi 5 persen? Bagaimana jika digunakan tingkat signifikansi 1 persen? Dalam soal ini hipotesis yang akan diuji adalah H0 : µx = µy melawan hipotesis H1 : µx 6= µy . Karena kedua sampel diambil dari sebuah institusi, maka varian populasi dianggap sama. Kita gunakan indeks x menyatakan prokok dan indeks y bukan perokok. Berdasarkan data tersebut diperoleh nx = 11 X x = 129.18 Sx2 = 32.76, Sp2 = ny = 14 X y = 123.36 Sy2 = 32.86, (nx − 1)Sx2 + (my − 1)Sy2 10 · 32.76 + 13 · 32.86 = = 32.82 nx + my − 2 23 |X − Y | |129 − 123| |t| r =q = 2.52 1 1 1 1 32.82 + 2 Sp nx + ny 11 14 Karena t0.025,23 = 2.069 (berarti t0.025,23 < |t|), maka H0 ditolak, yang berarti bahwa rata-rata tekanan sistolik antara perokok dan bukan perokok berbeda 66 BAB 9. UJI HIPOTESIS pada tingkat signifikansi 5 persen. Karena t0.005,23 = 2.807, maka H0 diterima, dengan kata lain rata-rata tekanan sistolik antara perokok dengan bukan perokok tidak berbeda pada tingkat signifikansi 1 persen. 9.2.3 Varian tidak diketahui dan tidak sama Dimisalkan varian populasi σx2 dan σy2 tidak diketahui dan tidak sama. Karena Sx2 adalah estimator untuk σx2 dan Sy2 estimator untuk σy2 maka uji hipotesis H0 : µx = µy melawan H1 : µx 6= µy bisa berdasarkan pada statistik X −Y t= q 2 Sy2 Sx n + m Jika n dan m cukup besar, maka t akan mendekati distribusi normal standar. Aturan 9. (σx2 dan σy2 tidak sama dan tidak diketahui) Untuk n dan m besar 9.3 terima H0 jika tolak H0 jika X −Y ≤ zα/2 q |t| = Sx2 + Sy2 n m X −Y > zα/2 |t| = q Sx2 + Sy2 n m Uji t berpasangan Misalkan kita ingin mengetahui apakah ada perbedaan hasil pengukuran berat antara neraca O-haus dengan neraca pegas. Untuk tujuan tersebut kita ambil sampel n objek kemudian ditimbang beratnya dengan kedua alat. Oleh karena itu kita mendapatkan n pasang pengamatan yang kita tuliskan sebagai (Xi , Yi ), i = 1, 2, · · · , n dengan Xi dan Yi berturut-turut menyatakan hasil pengukuran dengan neraca O-haus dan neraca pegas objek ke i. Suatu cara untuk menguji hipotesis adanya perbedaan hasil pengukuran berat tersebut adalah dengan menghitung selisih kedua hasil pengukuran. Misalkan Wi menyatakan selisih antara pengukuran dengan neraca o-haus dan pengukuran dengan neraca pegas. Jika tidak ada perbedaan hasil pengukuran, maka Wi akan memiliki mean 0. Oleh karena itu kita dapat menuliskan uji hipotesisnya sebagai berikut. 9.4. UJI HIPOTESI TENTANG VARIAN POPULASI NORMAL 67 Aturan 10. Uji t berpasangan (t paired test). Untuk menguji hipotesis H0 : µw = 0 melawan H1 : µw 6= 0 √ terima H0 jika − tα/2, n−1 < n SWw < tα/2, n−1 tolah H0 untuk yang lainnya Contoh 66. Ingin diketahui apakah ada perbedaan hasil pengukuran berat benda antara necara o-haus dan neraca pegas. Untuk itu diambil 8 sampel benda dan timbang dengan kedua neraca. Misalkan hasil pengukurannya (dalam newton) adalah sebagai berikut. No. Objek Neraca Ohaus Necara pegas 1 3.2 3.1 2 4.5 4.6 3 5.3 5.1 4 9.6 9.5 5 4.6 4.7 6 8.0 8.1 7 7.3 7.1 8 2.2 2.0 Penyelesaian Misalkan wi menyatakan selisih hasil pengukuran neraca ohaus dan neraca pegas. Beradasarkan data di atas diperoleh No. Objek wi 1 0.1 2 -0.1 3 0.2 4 0.1 5 -0.1 6 -0.1 7 0.2 8 0.2 Dapat dihitung bahwa mean selisih kedua hasil pengukuran adalah w̄ = 0.0625 dan deviasi standarnya adalah sw = 0.1408. Selanjutnya, karena n = 8, maka √ 0.0625 √ w n = 1.2555 = 8 sw 0.1408 dan tα/2, n−1 = t0.025, 7 = 2.3646. Karena −tα/2, n−1 < √ W n < tα/2, n−1 Sw maka H0 diterima, yang berarti bahwa tidak ada perbedaan hasil pengukuran kedua jenis alat pada tingkat signifikansi 5 persen. 9.4 Uji hipotesi tentang varian populasi normal Dalam aplikasi kita sering ingin mengetahui apakah informasi yang tertera pada kemasan suatu produk cukup dapat dipercaya. Sebagai contoh, apakah sutau jenis obat memiliki kadar paracetamol dengan variasi tertentu. Dalam hal demikian, kita dapat menguji apakah varian kadar paracetamol tidak berbeda dengan standar varian yang diijinkan. Misalkan X1 , X2 , · · · , Xn adalah sampel random dari populasi normal dengan mean µ dan varian σ 2 yang keduanya tidak diketahui. Akan diuji hipotesis H0 : σ 2 = σ02 68 BAB 9. UJI HIPOTESIS melawan hipotesis alternatif H1 : σ 2 6= σ02 dengan σ02 suatu nilai tertentu. Ingat kembali bahwa (n−1)S 2 /σ 2 berdistribusi chi-square dengan derajat bebas n − 1. Aturan 11. Untuk menguji hipotesis H0 : σ 2 = σ02 melawan hipotesis alternatif H0 : σ 2 6= σ02 digunakan aturan terima H0 jika χ21−α/2,n−1 ≤ tolak H0 untuk lainnya (n−1)S 2 σ02 ≤ χ2α/2,n−1 Contoh 67. Ingin diketahui apakah varian kadar paracetamol suatu jenis obat tidak melebihi batas yang diijinkan pihak berwenang. Misalkan kadar yang ijinkan adalah memiliki varian 40 mg. Suatu sampel 12 obat diukur kadar paracetamolnya dan hasilnya adalah sebagai berikut (dalam mg). Apakah varian paracematmol dapat diterima pada tingkat signifikansi 1 persen? 512 532 502 510 508 502 505 511 510 507 509 512 Penyelesaian Diketahui σ02 = 40, n = 12 dan α = 0.01. Berdasarkan data dapat dihitung s2 = 60, α/2 = 0.005 sehingga 1 − α/2 = 0.995. Berdasarkan tabel chi-square diperoleh χ20.995,11 = 2.603 dan χ20.005,11 = 26.757. (n − 1)S 2 (12 − 1)(60) = = 16.5 σ02 40 2 Karena χ20.95,11 ≤ (n−1)S ≤ χ20.05,11 , maka H0 diterima. Ini berarti pada σ02 tingkat signifikansi 1 persen, varian paracematol jenis obat tersebut tidak melebihi batas yang diijinkan pihak berwenang. 9.5 Uji hipotesis kesamaan varian dua populasi normal Jika kita memiliki dua populasi, maka mungkin kita tertarik untuk mengetahui apakah variabilitas kedua populasi sama atau berbeda. Sebagai contoh, apakah variabilitas hasil panen padi lokal sama dengan variabilitas hasil panen padi unggul nasional. 9.5. UJI HIPOTESIS KESAMAAN VARIAN DUA POPULASI NORMAL 69 Diketahui X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym dua sampel independen dari dua populasi normal yang masing-masing memiliki parameter µx , σx2 dan µy , σy2 . Akan diuji H0 : σx2 = σy2 melawan H1 : σx2 6= σy2 Varian masing-masing sampel adalah n Sx2 = 1 X (Xi − X̄)2 n−1 i Sy2 = 1 X (Yi − Ȳ )2 m−1 i m Ingat kembali bahwa (n − 1)Sx2 /σx2 dan (m − 1)Sy2 /σy2 adalah variabel random indepnden dengan derajab bebas masing-masing n − 1 dan m − 1. Oleh karena itu Sx2 /σx2 Sy2 /σy2 berdistribsi F dengan derajat bebas pembilang n−1 dan derajat bebas penyebut m − 1. Aturan 12. Untuk menguji hipotesis H0 : σx2 = σy2 melawan H1 : σx2 6= σy2 pada tingkat signifikansi α digunakan aturan terima H0 jika F1−α/2, n−1,m−1 < Sx2 /Sy2 < Fα/2,n−1,m−1 tolak H0 untuk yang lain Contoh 68. Ingin diketahui apakah ada perbedaan variabilitas hasil panen padi lokal dengan padi unggul nasional pada tingkat signifikansi 5 persen. Suatu sampel padi lokal berukuran 10 dan sampel padi unggul nasional berukuan 13 diambil. Hasil pengamatan (dalam ton per hektar) adalah sebagai berikut. Padi lokal Padi unggul nasional 1.5 3.9 2.3 4.0 2.5 4.2 1.9 4.1 3.0 4.0 2.5 3.8 Penyelesaian Berdasarkan data di atas diperoleh Sx2 = 0.205 Sy2 = 0.0509 Sx2 /Sy2 = 0.205/0.0509 = 4.0277 Berdasarkan tabel, F0.95,9,12 = 2.80 1.7 3.9 1.8 4.3 2.0 4.5 2.3 4.4 3.8 3.9 4.0 70 9.6 BAB 9. UJI HIPOTESIS Uji Goodness of Fit Misalkan satu mata uang logam seimbang dilontarkan 1000 kali. Frekuensi harapan terjadinya sisi angka tentu 1000 · 21 = 500 kali. Namun demikian frekuensi terjadinya sisi angka hasil observasi bisa berbeda dengan frekuensi harapan tersebut. Untuk menguji apakah hasil percobaan ini sesuai dengan hasil teoritis digunakan satu uji statistik. Goodness of fit adalah suatu uji statistik untuk menentukan apakah suatu populasi memiliki distribusi tertentu. Misalkan kita memiliki k persitiwa E1 , E2 , · · · , Ek yang masing-masing dapat terjadi dengan peluang p1 , p2 , · · · , pk . Jika diambil sampel random berukuran n dari populasi ini, nilai observasi untuk peristiwa E1 , E2 , · · · , Ek dapat dinyatakan sebagai variabel random X1 , X2 , · · · , Xk . Frekuensi harapan peristiwaperistiwa tersebut masing-masing adalah np1 , np2 , · · · , npk . Dalam bentuk tabel dapat dinyatakan sebagai berikut. Peristiwa Frekuensi observasi Frekuensi harapan E1 x1 np1 ··· ··· ··· E2 x2 np2 Ek xk npk Aturan 13. Untuk menguji apakah nilai observasi menyimpang terhadap nilai harapan digunakan aturan sebagai berikut. χ2 = (X1 − np1 )2 (X2 − np2 )2 (Xk − npk )2 + + ··· + np1 np2 npk (9.1) terima H0 jika χ2 < χ2α,k−1 tolak H0 jika χ2 ≥ χ2α,k−1 Contoh 69. Satu dadu dilontarkan 120 kali. Hasil observasi dan nilai harapan setiap sisi dinyatakan dalam tabl berikut. Sisi Nilai observasi Nilai harapan 1 22 20 2 23 20 3 18 20 4 19 20 5 21 20 6 17 20 Jika dadu tersebut seimbang, tentu kita berharap setiap sisi memiliki peluang 1/6. Dengan demikian dalam 120 lontaran, setiap sisi diharapkan terjadi 1 6 120 = 20 kali. Namun berdasarkan hasil observasi, ternyata tidak semua sisi terjadi 20 kali. Apakah ini berarti dadu tersebut tidak seimbang? Untuk mengetahuinya kita gunakan uji chi-square. χ2 = (22 − 20)2 (23 − 20)2 (18 − 20)2 (19 − 20)2 (21 − 20)2 (17 − 20)2 + + + + + = 1.4 20 20 20 20 20 20 Berdasarkan tabel, χ20.05,5 = 11.070. Karena nilai yang dihitung χ2 < χ20.05,5 maka hipotesis nol diterima, dengan kata lain tidak cukup bukti untuk mengatakan bahwa dadu tidak seimbang. 9.7. UJI INDEPENDEN 9.7 71 Uji Independen Misalkan kita ingin mengetahui apakah tingkat pendapatan masyarakat independen terhadap keputusan untuk menolak atau menerima kenaikan BBM. Misalkan ada 3 tingkat pendapatan: miskin, sedang dan kaya. Dalam hal ini populasi memiliki dua karakteristik, yaitu yang setuju dan yang tidak setuju dengan kenaikan BBM. Kedua karakteristik masyarakat terbagi dalam 3 golongan, yaitu miskin, sedang dan kaya. Misalkan kita memiliki suatu populasi yang dapat diklasifikasikan menjadi dua karakteristik, namakan X dan Y . Misalkan ada r nilai yang mungkin untuk kelas X dan ada s nilai yang mungkin untuk klas Y . Peluang kelas X terjadi nilai i dan kelas Y terjadi nilai j ditulis Pij . Jadi Pij = P (X = i, Y = j) Setiap anggota populasi diasumsikan independen. Peluang sebarang anggota populasi memiliki sifat X dengan nilai iadalah X pi = j = 1s Pij Peluang sebarang anggota populasi memiliki sifat Y dengan nilai j adalah X qj = i = 1r Pij Misalkan kita ingin menguji hipotsis bahwa anggota populasi dengan sifat X dan Y independen, yaitu H0 : pij = pi qj melawan hipotesis H1 : pij 6= pi qj Karena nilai pi dan qi tidak dinyatakan secara spesifik di dalam hipotesis, maka kita harus menduga nilai tersebut. Banyaknya anggota populasi dengan karakteristik X dan berpendapat i adalah r X Ni = Nij j=1 Estimator untuk pi adalah p̂i = Ni , n i = 1, 2, · · · , r Banyaknya anggota populasi dengan karakeristik Y dan memilih j adalah Mj = r X i=1 Nij 72 BAB 9. UJI HIPOTESIS Estimator untuk qi adalah q̂i = Mj , n j = 1, 2, · · · , s Jika H0 benar, maka E(Nij ) = npi qj dan T = s X r X (Nij − np̂i q̂j )2 np̂i q̂j j=1 i=1 berdistribusi chi-square dengan derajat bebas (r − 1)(s − 1). Oleh karena itu Aturan 14. Untuk menguji hipotesis H0 : pij = pi qj melawan hipotesis H1 : pij 6= pi qj digunakan aturan T = r s X X (Nij − np̂i q̂j )2 np̂i q̂j j=1 i=1 terima H0 jika T ≥ χ2α,(r−1)(s−1) tolak H0 untuk lainnya Contoh 70. Untuk mengetahui apakah keputusan menolak atau menerima kenaikan BBM independen terhadap tingkat pendapatan masyarakat diambil sampel random berukuran 200 orang. Hasil observasi diberikan dalam tabel berikut (dinamakan tabel contingency). Tingkat pendapatan Setuju Tidak Setuju Jumlah Miskin 30 44 74 Sedang 32 35 67 Kaya 32 27 59 Jumlah 94 106 200 Dari tabel tersebut diperoleh 94 = 0.47 p̂1 = 200 106 p̂2 = 200 = 0.53 74 q̂1 = 200 = 0.37 67 = 0.335 q̂2 = 200 59 q̂3 = 200 = 0.295 np̂1 q̂1 = (200)(0.47)(0.37) = 34.78 np̂1 q̂2 = (200)(0.47)(0.335) = 31.49 np̂1 q̂3 = (200)(0.47)(0.295) = 27.73 np̂2 q̂1 = (200)(0.53)(0.37) = 39.22 np̂2 q̂2 = (200)(0.53)(0.335) = 35.51 np̂2 q̂3 = (200)(0.53)(0.295) = 31.27 2 2 2 + (32−31.49) + (32−27.73) + T = (30−34.78) 34.78 31.49 27.73 (44−39.22)2 39.22 + (35−35.51)2 35.51 + (27−31.27)2 31.27 = 2.5415. 9.7. UJI INDEPENDEN 73 Karena (r − 1)(s − 1) = 2 dan χ20.05,2 = 5.911, maka kita terima H0 , yakni keputusan untuk menerima atau menolak kenaikan BBM adalah independen. 74 BAB 9. UJI HIPOTESIS Bab 10 Regresi Linear Sederhana Di dalam bidang ilmu pengetahuan dan teknologi, kita sering mencari hubungan antara dua variabel, misalnya hubungan antara tekanan gas dengan temperatur, hubungan antara pendapatan dan konsumsi, hubungan antara lama belajar dan prestasi belajar, dan sebagainya. Hubungan di atas dapat dinyatakan sebagai hubungan dua variabel, yaitu variabel repon atau variabel tak bebas, dan variabel penjelas (explanatory) atau variabel bebas. Jika X menyatakan variabel bebas dan Y menyatakan variabel respon, maka hubungan kedua variabel dapat dinyatakan sebagai fungsi. Di dalam bagian ini kita akan mencari hubungan linear antara dua variabel. Hubungan demikian merupakan hubungan yang mudah ditangani dan banyak persoalan di dalam penerapan dapat dinyatakan dalam bentuk hubungan linear. Di dalam mencari hubungan antara variabel Y dan X biasanya kita mulai dengan melakukan observasi dan mencatat hasilnya dalam bentuk pasangan (Xi , Yi ). Contoh 71. Hasil 10 observasi temperatur gas (X) dan tekanan gas (Y ) diperoleh data berikut Observasi ke 1 2 3 4 5 6 7 8 9 10 Temperatur (◦ C) 60 70 80 90 100 110 120 130 140 150 75 Tekanan (atm) 2.3 2.5 2.6 3.3 3.8 3.9 4.2 4.4 4.5 4.7 76 BAB 10. REGRESI LINEAR SEDERHANA Untuk mencari hubungan antara tekanan dan temperatur, akan sangat membantu jika dibuat terlebih dahulu diagram yang menggambarkan titik-titik hasil observasi. Diagram demikian dinamakan diagram pencar (scater diagram). Gambar 10.1: Diagram pencar Hubungan linear antara variabl X dan Y dapat dituliskan sebagai persamaan garis lurus Ŷ = α + βX Tentu kita menginginkan agar garis lurus tersebut dapat mewakili titik-titik pada diagram pencar tersebut. Garis ini tentu tidak bisa melewati semua titiktitik pada diagam pencar tersebut. Oleh kerana itu ada deviasi antara titik-titik pada diagram dengan titik-titik pada garis tersebut. Dalam hal yang lebih umum, misalkan kita telah melakukan n percobaan yang datanya adalah Observasi ke 1 2 .. . X X1 X2 .. . Y Y1 Y2 .. . n Xn Yn . Model regresi linear sederhana dapat dituliskan sebagai Yi = α + βXi + i dimana: 10.1. SIFAT ESTIMATOR β̂ DAN α̂ 77 • Yi nilai variabel respon observasi ke i • α dan β adalah parameter • Xi nilai variabel bebas observasi ke i • i adalah kesalahan random yang diasumsikan berdistribusi normal dengan nilai harapan 0 dan varian σ 2 • i = 1, 2, · · · , n. Agar model tersebut dapat digunakan, parameter α dan β harus diestimasi. Kita tentu menghendaki agar suku kesalahan i dibuat sekecil mungkin. Ada suatu metoda di dalam matematika untuk mencari parameter ini sehingga jumlah kuadrat kesalannya adalah minimal, yaitu yang dinamakan least square method. Dengan menggunakan metoda ini, kedua parameter dapat diestimasi sebagai berikut: β̂ = Pn P Xi Yi −X n i=1 Yi Pn 2 2 X −nX i=1 i i=1 (10.1) α̂ = Y − β̂X Contoh 72. Berdasarkan data pengamatan, pada contoh 71 diperoleh n = 10, X = 105, n X Yi = 36.2, n X Xi2 = 118500, i=1 i=1 n X Xi Yi = 4038, i=1 Oleh karena itu α̂ dan β̂ dapat dicari sebagai berikut β̂ = 4038−105×36.2 118500−10×1052 = 0.0287 α̂ = 3.62 − (0.0287)(105) = 0.6036, yang berarti bahwa hubungan antara temperatur X dan tekanan Y dapat dinyatakan sebagai Ŷ = 0.6036 + 0.0287X. 10.1 Sifat Estimator β̂ dan α̂ Di dalam persamaan 10.1, nilai harapan dari β̂ dan α̂ berturut-turut adalah E(β̂) = β E(α̂) = α (10.2) Dengan demikian β̂ dan α̂ masing-masing merupakan estimator tak bias untuk parameter β dan α. 78 BAB 10. REGRESI LINEAR SEDERHANA Untuk mengetahui variabilitas kedua estimator, dapat dipelajari melalui varian kedua estimator. Varian β̂ dan α̂ adalah V ar(β̂) = V ar(α̂) = 2 P 2σ 2 xi −nx̄ P 2 σ2 xi P n( x2i −nx̄2 ) (10.3) Selisih antara nilai respon Yi dengan nilai prediksi Ŷi dinamakan residual, residual = Yi − α̂ − β̂xi Untuk mengukur seberapa besar ppenyimpnagan nilai respon terhadap prediksi diambil jumlah kuadrat residual. Jumlah kuadrat residual, ditulis SSR adalah SSR = X Yi − α̂ − β̂xi 2 Dapat dibuktikan bahwa SSR σ2 berdistribusi chi-square dengan derajat bebas n − 2. Oleh karena itu nilai harapan SSR/(n − 2) adalah SSR E = σ2 (n − 2) yang berarti SSR (n−2) merupakan estimator tak bias untuk parameter σ 2 . Untuk pembahasan selanjutnya, kita akan menggunakan notasi berikut: Pn Pn Sxx = Pi=1 (xi − x̄)2 = P i=1 x2i − nx̄2 n n 2 2 Syy = Pi=1 (yi − ȳ)2 = i=1 yP (10.4) i − nȳ n n Sxy = i=1 (xi − x̄)(yi − ȳ) = i=1 xi yi − nx̄ȳ 10.2 Inferensi tentang parameter β dan α Karena β̂ merupakan estimator, maka kita bisa membentuk interval kepercayaan parameter β. Interval kepercayaan 100(1 − α) persen untuk β diberikan oleh s s ! SSR SSR , β̂ + tα/2,n−2 β̂ − tα/2,n−2 (n − 2)Sxx (n − 2)Sxx Di dalam persamaan regresi y = α + βx + e penting untuk menguji hipotesis apakah β sama dengan 0, yaitu H0 : β = 0 melawan H1 : β 6= 0 10.3. KOEFISIEN DETERMINASI 79 pada tingkat signifikansi α. Untuk menguji H0 pada tingkat signifikansi α digunakan statistik penguji r (n − 2)Sxx t= β SSR dimana H0 diterima jika |t| ≤ tα/2,n−2 dam ditolak jika |t| > tα/2,n−2 . Interval kepercayaan untuk parameter intersep α adalah s P α̂ − 10.3 x2i SSR tα/2,n−2 , α̂ + n(n − 2)Sxx s P x2i SSR tα/2,n−2 n(n − 2)Sxx ! (10.5) Koefisien Determinasi Berdasarkan data (X1 , Y1 ), (X2 , Y2 ), · · · , (Xn , Yn ), kita bisa mencari variasi variabel respon Y yang disebabkan pengaruh variabel penjelas X. Variasi variabel Y didefinisikan oleh Syy = n X (Yi − Ȳ )2 (10.6) i=1 Karena Y = α + βX + , maka variasi Y disebabkan oleh dua komponen, yaitu • komponen variasi yang disebabkan oleh variabel bebas X • komponen variasi yang disebabkan oleh faktor kesalahan random . Karena variasi yang sebabkan oleh faktor kesalahan random adalah SSR, maka variasi yang disebabkan oleh variabel penjelas X = variasi Y - variasi oleh kesalahan random. Proporsi variasi yang disebabkan oleh variabel penjelas dinamakan koefisien determinasi, ditulis R2 . Dengan demikian R2 = variasi X Syy − SSR SSR = =1− variasi Y Syy Syy (10.7) Perhatikan bahwa 0 ≤ Syy − SSR ≤ Syy . Oleh karena itu nilai koefisien determinasi memenuhi 0 ≤ R2 ≤ 1. Nilai koefisien determinasi R2 dapat digunakan untuk menilai seberapa tepat model regresi yang telah diperoleh. Nilai R2 = 1 menunjukan model regresi yang diperoleh sangat baik, sedangkan nilai R2 = 0 menunjukan model regresi yang diperoleh sangat jelek untuk menggambarkan hubungan kedua variabel. 80 BAB 10. REGRESI LINEAR SEDERHANA 10.4 Korelasi Korelasi merupakan ukuran keeratan hubungan antara dua variabel. Di dalam korelasi tidak dipersoalkan hubungan sebab akibat. Dengan demikian pernyataan ”korelasi antara variabel X dan Y ” sama saja dengan pernyataan ”korelasi antara variabel Y dan X”. Keeratan hubungan antara dua variabel dinyatakan dengan koefisien korelasi. Jika (x1 , y1 ), (x2 , y2 ), · · · , (xn , yn ) adalah data sampel, maka koefisien korelasi antara variabel X dan Y , ditulis r, didefinisikan Pn (xi − x̄)(yi − ȳ) (10.8) r = pPn i=1 Pn 2 2 (x i=1 (yi − ȳ) i=1 i − x̄) Nilai koefisien korelasi adalah antara −1 sampai dengan 1, yakni −1 ≤ r ≤ 1 Variabel X dan Y dikatakan berkorelasi positif jika r > 0, dikatakan berkorelasi negatif jika r < 0 dan dikatakan tidak berkorelasi jika r−0. Jika X dan Y berkorelasi positif, maka dengan meningkatnya nilai X, nilai Y juga meningkat. Jika korelasi antara X dan Y negatif, maka semakin besar nilai X semakin menurun nilai Y . Jika X tidak berkorelasi dengan Y maka perubahan X tidak mempengaruhi perubahan Y . Nilai koefisien korelasi yang mendekati 1 mengindikasikan hubungan kuat positif antara variabel X dan Y , nilai koefisien korelasi yang mendekadi −1 menunjukan hubungan kuat negatif antara X dan Y . Dengan menggunakan notasi 10.4 di atas, persamaan 10.8 dapat dituliskan sebagai Pn (xi − x̄)(yi − ȳ) Sxy (10.9) =p r = pPn i=1 Pn 2 2 Sxx Syy i=1 (xi − x̄) i=1 (yi − ȳ) Karena SSR = 2 Sxx Syy −Sxy , Sxx r2 maka = 2 Sxy Sxx Syy Sxx Syy −SSRSxx Sxx Syy 1 − SSR Syy 2 = = = R , yakni |r| = √ R2 Ini berarti nilai absolut koefisien korelasi sama dengan akar dua koefisien determinasi. Tanda r sama dengan tanda koefisien β̂ didalam persamaan regresi. Daftar Pustaka [1] Brase, C.H., and Brase, C.P., Understanding Basic Statistics., 4th ed., Houghton Mifflin Company, New York, 2007. [2] Hogg, R.V., and Craig, A.T., Introduction to Mathematical Statistics., 3rd ed., Macmillan Publishing Co Inc.,New York, 1970. [3] Ross, S.M., Probability and Statistics for Engineer and Scientits., 3rd ed., Elsevier Academic Press, USA, 2004. 81 82 DAFTAR PUSTAKA Appendix Tabel-tabel penting 83 84 DAFTAR PUSTAKA Lampiran 1. Distribusi Normal Standar Kuantitas-kuantitas di dalam tabel adalah P (X ≤ x) = Φ(x) x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 Φ(x) 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.6179 x 0.31 0.32 0.33 0.34 0.35 0.36 0.37 0.38 0.39 0.40 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 0.49 0.50 0.51 0.52 0.53 0.54 0.55 0.56 0.57 0.58 0.59 0.60 0.61 Φ(x) 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.7257 0.7291 x 0.62 0.63 0.64 0.65 0.66 0.67 0.68 0.69 0.70 0.71 0.72 0.73 0.74 0.75 0.76 0.77 0.78 0.79 0.80 0.81 0.82 0.83 0.84 0.85 0.86 0.87 0.88 0.89 0.90 0.91 0.92 Φ(x) 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.8159 0.8186 0.8212 x 0.93 0.94 0.95 0.96 0.97 0.98 0.99 1.00 1.01 1.02 1.03 1.04 1.05 1.06 1.07 1.08 1.09 1.10 1.11 1.12 1.13 1.14 1.15 1.16 1.17 1.18 1.19 1.20 1.21 1.22 1.23 Φ(x) 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 0.8849 0.8869 0.8888 0.8907 DAFTAR PUSTAKA 85 Lanjutan Distribusi Normal Standar x 1.24 1.25 1.26 1.27 1.28 1.29 1.30 1.31 1.32 1.33 1.34 1.35 1.36 1.37 1.38 1.39 1.40 1.41 1.42 1.43 1.44 1.45 1.46 1.47 1.48 1.49 1.50 1.51 1.52 1.53 1.54 Φ(x) 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 0.9332 0.9345 0.9357 0.9370 0.9382 x 1.55 1.56 1.57 1.58 1.59 1.6 1.61 1.62 1.63 1.64 1.65 1.66 1.67 1.68 1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77 1.78 1.79 1.8 1.81 1.82 1.83 1.84 1.85 Φ(x) 0.9394 0.9406 0.9418 0.9429 0.9441 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 x 1.86 1.87 1.88 1.89 1.90 1.91 1.92 1.93 1.94 1.95 1.96 1.97 1.98 1.99 2.00 2.01 2.02 2.03 2.04 2.05 2.06 2.07 2.08 2.09 2.10 2.11 2.12 2.13 2.14 2.15 2.16 Φ(x) 0.9686 0.9693 0.9699 0.9706 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 x 2.17 2.18 2.19 2.20 2.21 2.22 2.23 2.24 2.25 2.26 2.27 2.28 2.29 2.30 2.31 2.32 2.33 2.34 2.35 2.36 2.37 2.38 2.39 2.40 2.41 2.42 2.43 2.44 2.45 2.46 2.47 Φ(x) 0.9850 0.9854 0.9857 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 86 DAFTAR PUSTAKA Lanjutan Distribusi Normal Standar x 2.48 2.49 2.50 2.51 2.52 2.53 2.54 2.55 2.56 2.57 2.58 2.59 2.60 2.61 2.62 2.63 2.64 2.65 2.66 2.67 2.68 2.69 2.70 2.71 2.72 2.73 2.74 2.75 2.76 2.77 2.78 Φ(x) 0.9934 0.9936 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 x 2.79 2.80 2.81 2.82 2.83 2.84 2.85 2.86 2.87 2.88 2.89 2.90 2.91 2.92 2.93 2.94 2.95 2.96 2.97 2.98 2.99 3.00 3.01 3.02 3.03 3.04 3.05 3.06 3.07 3.08 3.09 Φ(x) 0.9974 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 x 3.1 3.11 3.12 3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20 3.21 3.22 3.23 3.24 3.25 3.26 3.27 3.28 3.29 3.3 3.31 3.32 3.33 3.34 3.35 3.36 3.37 3.38 3.39 3.40 Φ(x) 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 0.9997 x 3.41 3.42 3.43 3.44 3.45 3.46 3.47 3.48 3.49 3.50 3.51 3.52 3.53 3.54 3.55 3.56 3.57 3.58 3.59 3.60 3.61 3.62 3.63 3.64 3.65 3.66 3.67 3.68 3.69 3.70 3.71 Φ(x) 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 DAFTAR PUSTAKA 87 Lampiran 2. Distribusil Chi-Square Kuantitas-kuantitas dalam tabel adalah bilangan x sehingga P (χ2 ≤ x) = λ λ r 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0.99 6.6349 9.2103 11.3449 13.2767 15.0863 16.8119 18.4753 20.0902 21.6660 23.2093 24.7250 26.2170 27.6882 29.1412 30.5779 31.9999 33.4087 34.8053 36.1909 37.5662 38.9322 40.2894 41.6384 42.9798 44.3141 45.6417 46.9629 48.2782 49.5879 50.8922 0.975 5.0239 7.3778 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 20.4832 21.9200 23.3367 24.7356 26.1189 27.4884 28.8454 30.1910 31.5264 32.8523 34.1696 35.4789 36.7807 38.0756 39.3641 40.6465 41.9232 43.1945 44.4608 45.7223 46.9792 0.95 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0671 15.5073 16.9190 18.3070 19.6751 21.0261 22.3620 23.6848 24.9958 26.2962 27.5871 28.8693 30.1435 31.4104 32.6706 33.9244 35.1725 36.4150 37.6525 38.8851 40.1133 41.3371 42.5570 43.7730 0.05 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 3.9403 4.5748 5.2260 5.8919 6.5706 7.2609 7.9616 8.6718 9.3905 10.1170 10.8508 11.5913 12.3380 13.0905 13.8484 14.6114 15.3792 16.1514 16.9279 17.7084 18.4927 0.025 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 3.2470 3.8157 4.4038 5.0088 5.6287 6.2621 6.9077 7.5642 8.2307 8.9065 9.5908 10.2829 10.9823 11.6886 12.4012 13.1197 13.8439 14.5734 15.3079 16.0471 16.7908 0.01 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 2.5582 3.0535 3.5706 4.1069 4.6604 5.2293 5.8122 6.4078 7.0149 7.6327 8.2604 8.8972 9.5425 10.1957 10.8564 11.5240 12.1981 12.8785 13.5647 14.2565 14.9535 88 DAFTAR PUSTAKA Lampiran 3. Distribusi t-Student’s Kuantitas-kuantitas dalam tabel adalah bilangan x sehingga P (tr ≤ x) = λ r 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 0.9 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722 1.3634 1.3562 1.3502 1.3450 1.3406 1.3368 1.3334 1.3304 1.3277 1.3253 1.3232 1.3212 1.3195 1.3178 1.3163 1.3150 1.3137 1.3125 1.3114 1.3104 1.3095 1.3086 1.3077 1.3070 1.3062 1.3055 1.3049 1.3042 1.3036 1.3031 1.3025 1.3020 1.3016 1.3011 1.3006 0.95 6.3138 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 1.7247 1.7207 1.7171 1.7139 1.7109 1.7081 1.7056 1.7033 1.7011 1.6991 1.6973 1.6955 1.6939 1.6924 1.6909 1.6896 1.6883 1.6871 1.6860 1.6849 1.6839 1.6829 1.6820 1.6811 1.6802 1.6794 λ 0.975 12.7062 4.3027 3.1824 2.7764 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281 2.2010 2.1788 2.1604 2.1448 2.1314 2.1199 2.1098 2.1009 2.0930 2.0860 2.0796 2.0739 2.0687 2.0639 2.0595 2.0555 2.0518 2.0484 2.0452 2.0423 2.0395 2.0369 2.0345 2.0322 2.0301 2.0281 2.0262 2.0244 2.0227 2.0211 2.0195 2.0181 2.0167 2.0154 2.0141 0.99 31.8205 6.9646 4.5407 3.7469 3.3649 3.1427 2.9980 2.8965 2.8214 2.7638 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280 2.5176 2.5083 2.4999 2.4922 2.4851 2.4786 2.4727 2.4671 2.4620 2.4573 2.4528 2.4487 2.4448 2.4411 2.4377 2.4345 2.4314 2.4286 2.4258 2.4233 2.4208 2.4185 2.4163 2.4141 2.4121 0.995 63.6567 9.9248 5.8409 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453 2.8314 2.8188 2.8073 2.7969 2.7874 2.7787 2.7707 2.7633 2.7564 2.7500 2.7440 2.7385 2.7333 2.7284 2.7238 2.7195 2.7154 2.7116 2.7079 2.7045 2.7012 2.6981 2.6951 2.6923 2.6896 DAFTAR PUSTAKA 89 Lanjutan Distribusi t-Student’s r 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 0.9 1.3002 1.2998 1.2994 1.2991 1.2987 1.2984 1.2980 1.2977 1.2974 1.2971 1.2969 1.2966 1.2963 1.2961 1.2958 1.2956 1.2954 1.2951 1.2949 1.2947 1.2945 1.2943 1.2941 1.2939 1.2938 1.2936 1.2934 1.2933 1.2931 1.2929 1.2928 1.2926 1.2925 1.2924 1.2922 1.2921 1.2920 1.2918 1.2917 1.2916 1.2915 1.2914 1.2912 1.2911 1.2910 0.95 1.6787 1.6779 1.6772 1.6766 1.6759 1.6753 1.6747 1.6741 1.6736 1.6730 1.6725 1.6720 1.6716 1.6711 1.6706 1.6702 1.6698 1.6694 1.6690 1.6686 1.6683 1.6679 1.6676 1.6672 1.6669 1.6666 1.6663 1.6660 1.6657 1.6654 1.6652 1.6649 1.6646 1.6644 1.6641 1.6639 1.6636 1.6634 1.6632 1.6630 1.6628 1.6626 1.6624 1.6622 1.6620 λ 0.975 2.0129 2.0117 2.0106 2.0096 2.0086 2.0076 2.0066 2.0057 2.0049 2.0040 2.0032 2.0025 2.0017 2.0010 2.0003 1.9996 1.9990 1.9983 1.9977 1.9971 1.9966 1.9960 1.9955 1.9949 1.9944 1.9939 1.9935 1.9930 1.9925 1.9921 1.9917 1.9913 1.9908 1.9905 1.9901 1.9897 1.9893 1.9890 1.9886 1.9883 1.9879 1.9876 1.9873 1.9870 1.9867 0.99 2.4102 2.4083 2.4066 2.4049 2.4033 2.4017 2.4002 2.3988 2.3974 2.3961 2.3948 2.3936 2.3924 2.3912 2.3901 2.3890 2.3880 2.3870 2.3860 2.3851 2.3842 2.3833 2.3824 2.3816 2.3808 2.3800 2.3793 2.3785 2.3778 2.3771 2.3764 2.3758 2.3751 2.3745 2.3739 2.3733 2.3727 2.3721 2.3716 2.3710 2.3705 2.3700 2.3695 2.3690 2.3685 0.995 2.6870 2.6846 2.6822 2.6800 2.6778 2.6757 2.6737 2.6718 2.6700 2.6682 2.6665 2.6649 2.6633 2.6618 2.6603 2.6589 2.6575 2.6561 2.6549 2.6536 2.6524 2.6512 2.6501 2.6490 2.6479 2.6469 2.6459 2.6449 2.6439 2.6430 2.6421 2.6412 2.6403 2.6395 2.6387 2.6379 2.6371 2.6364 2.6356 2.6349 2.6342 2.6335 2.6329 2.6322 2.6316 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 db penyebut (r2 ) 161.4476 18.5128 10.1280 7.7086 6.6079 5.9874 5.5914 5.3177 5.1174 4.9646 4.8443 4.7472 4.6672 4.6001 4.5431 4.4940 4.4513 4.4139 4.3807 4.3512 1 199.5000 19.0000 9.5521 6.9443 5.7861 5.1433 4.7374 4.4590 4.2565 4.1028 3.9823 3.8853 3.8056 3.7389 3.6823 3.6337 3.5915 3.5546 3.5219 3.4928 2 215.7073 19.1643 9.2766 6.5914 5.4095 4.7571 4.3468 4.0662 3.8625 3.7083 3.5874 3.4903 3.4105 3.3439 3.2874 3.2389 3.1968 3.1599 3.1274 3.0984 3 224.5832 19.2468 9.1172 6.3882 5.1922 4.5337 4.1203 3.8379 3.6331 3.4780 3.3567 3.2592 3.1791 3.1122 3.0556 3.0069 2.9647 2.9277 2.8951 2.8661 4 230.1619 19.2964 9.0135 6.2561 5.0503 4.3874 3.9715 3.6875 3.4817 3.3258 3.2039 3.1059 3.0254 2.9582 2.9013 2.8524 2.8100 2.7729 2.7401 2.7109 5 233.9860 19.3295 8.9406 6.1631 4.9503 4.2839 3.8660 3.5806 3.3738 3.2172 3.0946 2.9961 2.9153 2.8477 2.7905 2.7413 2.6987 2.6613 2.6283 2.5990 6 db pembilang (r1 ) 7 236.7684 19.3532 8.8867 6.0942 4.8759 4.2067 3.7870 3.5005 3.2927 3.1355 3.0123 2.9134 2.8321 2.7642 2.7066 2.6572 2.6143 2.5767 2.5435 2.5140 Distribusi F Kuantitas-kuantitas di dalam tabel adalah nilai x sehingga P (Fr1 ,r2 ≤ x) = 0.05 238.8827 19.3710 8.8452 6.0410 4.8183 4.1468 3.7257 3.4381 3.2296 3.0717 2.9480 2.8486 2.7669 2.6987 2.6408 2.5911 2.5480 2.5102 2.4768 2.4471 8 240.5433 19.3848 8.8123 5.9988 4.7725 4.0990 3.6767 3.3881 3.1789 3.0204 2.8962 2.7964 2.7144 2.6458 2.5876 2.5377 2.4943 2.4563 2.4227 2.3928 9 241.8817 19.3959 8.7855 5.9644 4.7351 4.0600 3.6365 3.3472 3.1373 2.9782 2.8536 2.7534 2.6710 2.6022 2.5437 2.4935 2.4499 2.4117 2.3779 2.3479 10 90 DAFTAR PUSTAKA 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 db penyebut (r2 ) 2 3 4 5 6 7 8 9 10 4052.1807 4999.5000 5403.3520 5624.5833 5763.6496 5858.9861 5928.3557 5981.0703 6022.4732 6055.8467 98.5025 99.0000 99.1662 99.2494 99.2993 99.3326 99.3564 99.3742 99.3881 99.3992 34.1162 30.8165 29.4567 28.7099 28.2371 27.9107 27.6717 27.4892 27.3452 27.2287 21.1977 18.0000 16.6944 15.9770 15.5219 15.2069 14.9758 14.7989 14.6591 14.5459 16.2582 13.2739 12.0600 11.3919 10.9670 10.6723 10.4555 10.2893 10.1578 10.0510 13.7450 10.9248 9.7795 9.1483 8.7459 8.4661 8.2600 8.1017 7.9761 7.8741 12.2464 9.5466 8.4513 7.8466 7.4604 7.1914 6.9928 6.8400 6.7188 6.6201 11.2586 8.6491 7.5910 7.0061 6.6318 6.3707 6.1776 6.0289 5.9106 5.8143 10.5614 8.0215 6.9919 6.4221 6.0569 5.8018 5.6129 5.4671 5.3511 5.2565 10.0443 7.5594 6.5523 5.9943 5.6363 5.3858 5.2001 5.0567 4.9424 4.8491 9.6460 7.2057 6.2167 5.6683 5.3160 5.0692 4.8861 4.7445 4.6315 4.5393 9.3302 6.9266 5.9525 5.4120 5.0643 4.8206 4.6395 4.4994 4.3875 4.2961 9.0738 6.7010 5.7394 5.2053 4.8616 4.6204 4.4410 4.3021 4.1911 4.1003 8.8616 6.5149 5.5639 5.0354 4.6950 4.4558 4.2779 4.1399 4.0297 3.9394 8.6831 6.3589 5.4170 4.8932 4.5556 4.3183 4.1415 4.0045 3.8948 3.8049 8.5310 6.2262 5.2922 4.7726 4.4374 4.2016 4.0259 3.8896 3.7804 3.6909 8.3997 6.1121 5.1850 4.6690 4.3359 4.1015 3.9267 3.7910 3.6822 3.5931 8.2854 6.0129 5.0919 4.5790 4.2479 4.0146 3.8406 3.7054 3.5971 3.5082 8.1849 5.9259 5.0103 4.5003 4.1708 3.9386 3.7653 3.6305 3.5225 3.4338 8.0960 5.8489 4.9382 4.4307 4.1027 3.8714 3.6987 3.5644 3.4567 3.3682 1 derajat bebas pembilang (r1 ) Lanjutan Distrbusi F Kuantitas-kuantitas di dalam tabel adalah nilai x sehingga P (Fr1 ,r2 ≤ x) = 0.01 DAFTAR PUSTAKA 91