Statistika - Universitas Muhammadiyah Palangkaraya

advertisement
Bahan Ajar
Statistika
Haryadi
NIDN 000311640
Universitas Muhammadiyah Palangkaraya
2012
Daftar Isi
1 Populasi dan Sampel
1.1 Pengantar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Sifat variabel dalam penelitian . . . . . . . . . . . . . . . . . . .
1
1
4
2 Penyajian Data
2.1 Distribusi Frekuensi . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Histogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Diagram Batang dan Daun . . . . . . . . . . . . . . . . . . . . .
7
7
9
12
3 Ringkasan Data
3.1 Ukuran Kecenderungan Pusat
3.2 Varian . . . . . . . . . . . . .
3.3 Persentil . . . . . . . . . . . .
3.4 Box Plot . . . . . . . . . . . .
3.5 Teorema Chebyshev . . . . .
15
15
18
19
21
22
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Peluang
23
4.1 Ruang Sampel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Peluang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3 Peluang Bersyarat . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5 Variabel Random
5.1 Variabel Random Diskrit . . . . . . . .
5.2 Nilai Harapan Variabel Random Diskrit
5.3 Variabel Random Kontinu . . . . . . . .
5.4 Variabel Random Bersama . . . . . . .
6 Beberapa Distribusi Peluang
6.1 Distribusi binomial . . . . . . . . . .
6.2 Distribusi Normal . . . . . . . . . . .
6.3 Distribusi yang berhubungan dengan
6.3.1 Distribusi Chi-Square . . . .
6.3.2 Distribusi t . . . . . . . . . .
6.3.3 Distribusi F . . . . . . . . . .
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
31
31
35
36
36
. . . . . . . . . .
. . . . . . . . . .
distribusi normal
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
39
39
40
43
43
43
44
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ii
DAFTAR ISI
7 Teori Sampling
8 Estimasi
8.1 Interval
8.2 Interval
8.3 Interval
8.4 Interval
Kepercayaan
Kepercayaan
Kepercayaan
Kepercayaan
45
untuk µ dengan σ Diketahui . . . .
untuk µ dengan σ Tidak Diketahui
untuk σ 2 . . . . . . . . . . . . . . .
Selisih Dua Mean . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
50
52
53
54
9 Uji Hipotesis
9.1 Uji tentang mean populasi normal . . . . . . . . .
9.1.1 Uji hipotesis dengan σ 2 diketahui . . . . . .
9.1.2 Uji hipotesis dengan σ 2 tidak diketahui . .
9.2 Uji kesamaan mean dua populasi . . . . . . . . . .
9.2.1 Varian populasi diketahui . . . . . . . . . .
9.2.2 Varian populasi tidak diketahui . . . . . . .
9.2.3 Varian tidak diketahui dan tidak sama . . .
9.3 Uji t berpasangan . . . . . . . . . . . . . . . . . .
9.4 Uji hipotesi tentang varian populasi normal . . . .
9.5 Uji hipotesis kesamaan varian dua populasi normal
9.6 Uji Goodness of Fit . . . . . . . . . . . . . . . . . .
9.7 Uji Independen . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
58
58
61
62
63
64
66
66
67
68
70
71
10 Regresi Linear Sederhana
10.1 Sifat Estimator β̂ dan α̂ . . .
10.2 Inferensi tentang parameter β
10.3 Koefisien Determinasi . . . .
10.4 Korelasi . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
75
77
78
79
80
. . . .
dan α
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Daftar Pustaka
81
Appendix
83
Bab 1
Populasi dan Sampel
1.1
Pengantar
Banyak kesimpulan sehari-hari didasarkan pada informasi yang tidak lengkap.
Kesimpulan semacam ini tentu mengandung ketidak pastian. Di dalam statistika, kita akan mempelajari bagaimana menggali informasi atau membuat kesimpulan berdasarkan informasi yang tidak lengkap.
Definisi 1. Statistika merupakan studi tentang bagaimana mengumpulkan,
mengorganisasi, menganalisis dan menginterpretasikan data.
Dengan demikian persyaratan untuk dapat melakukan studi dengan statistika adalah adanya data. Data diperoleh dengan melakukan observasi dari
karakter individu-indvidu yang menjadi perhatian kita.
Sering terjadi data yang diperlukan dalam studi statistik sudah tersedia,
misalnya data yang diterbitkan oleh Badan Pusat Statistik. Dapat pula terjadi
data yang diperlukan dalam studi belum tersedia. Dalam hal data belum terdesia maka perlu diadakan dengan jalan melakukan observasi atau eksperimen.
Definisi 2. Variabel adalah karakteristik yang diukur atau diobservasi dari
suatu objek.
Variabel kuantitatif adalah variabel yang dinyatakan dalam bentuk bilangan
atau numerik.
Variabel kualitatif adalah variabel yang dinyatakan dalam kategori atau
1
2
BAB 1. POPULASI DAN SAMPEL
kelompok tertentu
Jika kita ingin meneliti prestasi belajar siswa suatu kelas, maka variabelnya
dapat berupa nilai hasil belajar. Penelitian tentang tingkat kemasaman air di
Palangkaraya, variabelnya bisa berupa pH air. Suatu penelitian yang bertujuan
untuk mengetahui jenis warna yang disukai anak TK, variabelnya dapat berupa
warna.
Definisi 3. Populasi adalah kumpulan semua individu ( objek) yang menjadi
perhatian studi.
Bagian dari populasi dinamakan sampel.
Banyaknya anggota populasi dinamakan ukuran populasi.
Banyaknya anggota sampel dinamakan ukuran sampel.
Data yang diperoleh dari sampel dinamakan data sampel.
Contoh 1. Suatu studi bertujuan untuk mengetahui berat badan rata-rata
mahasiswa UM Palangkaraya. Karena keterbatasan tenaga dan waktu, maka
diambil sampel 100 orang mahasiswa untuk timbang berat badannya. Dalam
studi ini, populasinya adalah seluruh mahasiswa UM Palangkaraya, sampelnya
adalah ke 100 mahasiswa tersebut, dan variabelnya adalah berat badan yang
merupakan variabel kuantitatif. Jelas bahwa rata-rata berat badan yang diukur
dari 100 mahasiswa tidak menjamin akan mencerminkan rata-rata berat badan
seluruh mahasiswa UM Palangkaraya. Hal ini dikarenakan informasinya tidak
lengkap. Dalam hal ini bisa saja seluruh mahasiswa UM Palangkraya ditimbang
berat badanya agar diperoleh kesimpulan yang tepat, namun tentu diperlukan
waktu dan biaya yang lebih besar dibanding dengan mengamati 100 mahasiswa.
Dalam suatu studi umumnya kita menggunakan dapat sampel. Banyak
alasan mengapa kita mengunakan data sampel, diantaranya (i) keterbatasan
sumberdaya dan (ii) keterbatasan teknis.
Definisi 4. Parameter adalah suatu karateristik populasi.
Statistik adalah suatu nilai yang dihitung dari data sampel.
Pada contoh 1, parameternya adalah rata-rata berat badan seluruh mahasiswa UM Palangkaraya, yang dalam hal ini nilainya tidak diketahui; sedangkan
1.1. PENGANTAR
3
statistiknya adalah rata-rata berat badan yang dihitung dari ke 100 mahasiswa
tersebut.
Parameter umunya tidak diketahui nilainya. Oleh karena itu kita harus
cukup puas untuk menduga nilai parametr. Statistik digunakan untuk menduga
(to estimasi) parameter. Suatu statistik dikatakan representatif (mewakili) jika
dapat menggambarkan keadaan parameter dengan baik.
Ada banyak kriteria mengenai statistik yang baik untuk suatu parameter. Baik
tidaknya suatu statistik sangat bergantung pada bagaimana sampel tersebut
diambil dari populasi. Suatu proses pengambilan sampel dinamakan sampling.
Cara pengambilan sampel Ada beberapa cara pengambilan sampel:
• Random sampling
• Stratified sampling
• Sistematik sampling
• Cluster sampling
Sampel random berukuran n dari suatu populasi adalah bagian populasi
yang diambil dengan cara sedemikian sehingga:
1. setiap sampel berukuran n memiliki kesempatan yang sama untuk terpilih.
2. setiap anggota populasi memiliki kesempatan yang sama untuk terpilih.
Suatu prosedur untuk memperoleh sampel random adalah dengan menggunakan bilangan random. Bilangan random dapat diperoleh pada tabel bilangan
random, kalkulator atau program komputer.
Prosedur melakukan random sampling:
1. Beri nomor semua anggota populasi secara berurutan
2. Gunakan tabel, kalkulator atau komputer untuk memilih bilangan random.
3. Buatlah sampel dengan menggunakan anggota populasi yang nomornya
berkaitan dengan bilangan random yang terpilih.
Contoh 2. Akan diambil sampel random berukuran 10 dari sebuah kelas yang
memiliki 50 siswa. Langkah-langkahnya:
1. Beri nomor urut pada setiap anggota kelas mulai nomor 1 sampai dengan
nomor 50.
4
BAB 1. POPULASI DAN SAMPEL
2. Gunakan tabel bilangan random, dengan cara: pertama tunjuk sebarang
bilangan pada tabel, kemudian diteruskan dengan menuliskan bilangan
random berikutnya secukupnya. Misal dalam contoh ini diperoleh bilangan random mulai baris ke-7 dan kolom ke-9:
66
16391
94730
99938
95761
90704
75023
93621
48464
66330
65544
33393
96583
95261
18911
Karena banyaknya sampel merupakan bilangan dua digit, maka bilangan
random di atas dikelompokan menjadi dua digit :
66
64
99
39
94
65
93
39
73
54
89
52
09
49
07
61
57
65
04
61
83
93
75
18
62
02
91
16
34
11
63
84
63
30
91
33
3. Daftar semua anggoka kelas yang nomornya sesuai dengan nomor pada
bilangan random yang telah dikelompokan tersbut. Jika ditemui bilangan
yang lebih besar dari 50 maka diabaikan, dan jika diperoleh bilangan random yang sudah terpilih sebelumnya, maka diabaikan. Anggota populasi
yang terpilih sebagai anggota sampel adalah yang bernomor:
09
02
34
49
18
11
07
04
16
30
33.
Stratified sampling Stratified sampling adalah cara pengambilan sampel dari populasi yang memiliki strata tertentu. Misalnya, pada populasi mahasiswa UM Palangkaraya, stratanya dapat berupa lulusan SMA, sudah bekerja
dan mahasiswa pindahan. Pada teknik ini, populasi dibagi minimal dalam dua
strata, kemudian pada setiap strata pengambilan sampel dilakukan secara random sampling.
Sistematik sampling. Pada metode ini anggota populasi disusun dengan
urutan tertentu. Kemudian dilakukan pengambilan satu individu secara random, dan dilanjutkan dengan mengambil setiap anggota ke k dari sampel.
Cluster sampling . Pada metode ini, dimulai dengan membagi wilayah
menjadi beberapa bagian (cluster). Kemudian diambil secara random bagianbagian tersebut. Setiap anggota cluster menjadi anggota sampel.
1.2
Sifat variabel dalam penelitian
Didalam studi observasi, pengukuran terhadap anggota sampel dilakukan sehingga tidak merubah respon atau variabel yang diteliti.
Di dalam eksperimen, perlakuan diberikan pada individu untuk melihat perubahan respon atau variabel yang diukur.
1.2. SIFAT VARIABEL DALAM PENELITIAN
5
Untuk memperoleh data, kadang-kadang peneliti harus mengambil data dari
orang-orang dengan cara memberikan pertanyaan. Proses ini dinamakan survey.
Pengkategorian lain dari data adalah berdasarkan tingkat pengukuran,
dalam arti berdasarkan sifat aritmetika data. Berdasarkan tingkat mengukuran, data dikelompokan menjadi:
1. Data nominal merupakan data yang tidak dapat (tidak berkmakna) jika
diurutkan secara aritmetika.
2. Data ordinal, yaitu data yang bisa diurutkan tetapi tidak dapat (tidak
bermakna) jika dibandingkan.
3. Data interval, yaitu data yang dapat urutkan dan perbedaan antara nilai
data ada maknanya.
4. Data rasio, yaitu data yang dapat dirutkan, perbedan antara nilai data
bermakna dan rasio antar nilai data juga bermakna. Pada data rasio nilai
0 merupakan nilai sebenarnya.
Contoh 3. Suatu data berisi informasi nama hewan di suatu kebun binatang:
harimau
jerapah
buaya
unta
Data ini termasuk data nominal. Perhatikan bahwa data tersebut hanya menyatakan nama, jadi jika diurutkan tidak ada artinya.
Contoh 4. Suatu penelitian bertujuan untuk mengetahui tingkat kesukaan konsumen terhadap suatu produk. Variabel yang diamati adalah sebagai berikut:
Suka
Sedang
Tidak suka
Perhatikan bahwa data ini dapat diurutkan, namun selisih antar tingkat kesukaan tidak bermakna.
Contoh 5. Temperatur di kota Palangkaraya merupakan data interval, sebab
nilai temperatur dapat diurutkan dan selisih antara nilai temperatur memiliki
makna. Misalnya pada pagi hari temperaurnya 23o dan pada siang hari 30o ,
perbedaaanya menyatakan bahwa pada siang hari temperaturnya 7o lebih panas
dibanding pagi hari. Perhatikan pula bahwa temperatur 0o tidak berarti tidak
ada panas, yakni nilai ini bukan nilai sebenarnya.
Contoh 6. Data penghasil 5 orang per bulan (dalam juta rupiah) adalah sebagai berikut:
6
BAB 1. POPULASI DAN SAMPEL
No. Urut. Penghasilan
1.
2
2.
4,5
3.
13
4.
0,5
5.
0,0
Sifat data ini adalah dapat urutkan, dapat dikurangkan antar nilai-nilainya dan
nilai 0 adalah nilai yang sebenarnya, yaitu tidak punya penghasilan. Dengan
demikian data ini termasuk data rasio.
Bab 2
Penyajian Data
2.1
Distribusi Frekuensi
Jika kita memiliki suatu data kuantitatif yang ukuran cukup besar, maka akan
berguna jika data tersebut dikelompokan menjadi interval atau klas yang lebih
kecil. Dalam penyajian data dengan tabel frekuensi, data dipartisi menjadi
kelas atau interval dan menampilkan banyaknya nilai data yang termasuk pada
setiap kelas.
Definisi 5.
• Kelas atau interval dibentuk sehingga setiap nilai data termasuk kedalam tepat satu kelas.
• Kelas berupa interval bilangan; jadi memiliki batas bawah dan batas atas.
• Titik tengah kelas adalah bilangan yang posisinya di tengah kelas.
• Lebar kelas menyatakan selisih antara batas atas dan batas bawah kelas
tersebut.
Lebar kelas =
N ilai data terbesar −
banyaknya
N ilai data terkecil
kelas
• Frekuensi kelas adalah banyaknya nilai yang termasuk suatu kelas.
• Frekuensi relatif adalah frekuensi dibagi banyaknya nilai data.
7
8
BAB 2. PENYAJIAN DATA
• Frekuensi Kumulatif suatu kelas adalah banyaknya seluruh nilai data
yang lebih kecil dari batas atas kelas tersebut.
• Frekuensi kumulatif
banyaknya data.
relatif adalah frekuensi kumulatif dibagi
Contoh 7. Data hasil ujian mata kuliah Statistika 40 mahasiswa berikut akan
disajikan dalam bentuk frekuensi distribusi dengan 6 kelas.:
78
60
68
67
60
76
87
58
45
65
95
78
65
60
54
65
80
55
67
89
95
54
58
85
40
75
87
76
40
84
56
68
46
48
43
64
55
58
56
60
Langkah-langkah membentuk tabel frekuensi:
1. Tentukan lebar kelas:
Lebarkelas =
95 − 40
= 9.16.
6
dibulatkan menjadi 10.
2. Tentukan kelas (interval kelas) sebagai berikut:
• Ambil nilai data terkecil sebagai batas bawah kelas pertama, dalam
hal ini adalah 40.
• Batas bawah kelas berikutnya = batas bawah nilai sebelumnya + 10.
Jadi batas bawah kelas kedua adalah 40 + 10 = 50.
• Batas bawah kelas diperoleh dengan mengambil nilai tepat di bawah
batas atas kelas berikutnya. Jadi batas kelas pertama adalah 59.
• Proses ini dilanjutkan untuk kelas-kelas berikutnya.
3. Sekarang setiap nilai data dapat dimasukan ke dalam kelas masing-masing.
Untuk menghitung frekuensi setiap kelas dapat menggunakan dengan bantuan tally.
Diperoleh tabel frekuensi sebagai berikut:
2.2. HISTOGRAM
2.2
9
Interval Kelas
Frekuensi
Frekuensi
Relatif
Frekuensi
Kumulatif
40-49
50-59
60-69
70-79
80-89
90-99
Jumlah
6
9
12
5
6
2
40
0.15
0.225
0.3
0.125
0.15
0.05
1
6
15
27
32
38
40
Frekuensi
Kumulatif
Relatif
0.15
0.375
0.675
0.800
0.950
1.00
Histogram
Dari tbel frekuensi dapat disajikan bentuk visualnya. Histogram merupakan
cara yang cukup efektif untuk menyajikan data dalam bentuk visual. Pada
histogram:
• setiap kelas dinyatakan dengan sebuah batang
• lebar batang menyatakan lebar kelas
• tinggi batang menyatakan frekuensi kelas atau frekuensi relatif kelas
• nilai dibawah setiap batang adalah titik tengah kelas.
Histogram frekuensi pada contoh 1 adalah
10
BAB 2. PENYAJIAN DATA
Bentuk histogram dari suatu sampel random menggambarkan bagaimana
nilai data berdistribusi pada populasi. Bentuk histogram dapat dikelompokan
menjadi:
1. Simetris, yaitu histogram yang mentuknya (hampir) simetris terhadap suatu sumbu.
2. Seragam, yaitu histogram yang frekuensi setiap kelasnya sama atau hampir sama.
3. Menceng kiri atau menceng kanan, yaitu histogram yang ekornya menjulur lebih panjang ke satu sisi. Jika ekornya lebih menjulur kekiri maka
dinamakan menceng kekiri, jika ekornya lebih menjulur kekanan maka dinamakan menceng kekanan.
4. Bimodal, yaitu histogram yang memiliki dua kelas dengan frekuensi tertetinngi
yang dipisahkan oleh kelas lainnya.
2.2. HISTOGRAM
11
Kadang-kadang kita ingin menyajikan histogram dengan bentuk tertentu.
Diagram pareto adalah grafik batang yang disajikan secara urut berdasarkan
tingginya. Sebagai contoh, diagram pareto untuk contoh 1 adalah:
Grafik runtun waktu adalah grafik yang menggambarkan bagaimana data
berubah terhadap waktu.
Misalnya data mahasiswa UM Palangkaraya 10 tahun terakhir adalah
12
BAB 2. PENYAJIAN DATA
2003
3900
2004
4500
2005
4200
2006
3300
2007
3600
2008
3000
2009
3100
2010
3200
2011
3400
2012
3500
Grafik runtun waktu data ini adalah
2.3
Diagram Batang dan Daun
Diagram batang dan daun menyajikan data dalam bentuk susunan dan kelompok tertentu. Didalam tabel frekuensi dan histogram, kita kehilangan informasi
tentang nilai data. Di dalam diagram batang dan daun, informasi mengenai nilai data asli tidak hilang.
Prosedur membuat diagram batang-daun:
1. Bagi digit tiap nilai data menjadi dua bagian. Bagian paling kiri dinamakan batang dan bagian kanan dinamakan daun.
2. Susun semua batang secara vertikal mulai dari nilai terkecil hingga nilai
terbesar.
3. Tuliskan semua daun yang batangnya sama pada baris batang yang sama,
lalu susun daun dengan urutan makin membesar.
Contoh 8. Data nilai ujian Statistika pada contoh 1 akan disajikan dalam
diagram batang daun. Digit pertama sebagai batang dan digit kedua sebagai
daun. Berdasarkan prosedur di atas diperoleh
2.3. DIAGRAM BATANG DAN DAUN
4
5
6
7
8
9
0
4
0
5
0
5
0
4
0
6
4
5
3
5
0
6
5
5
5
0
8
7
6
6
4
8
7
8
6 8 8
5 5 5 7 7 8 8
9
13
14
BAB 2. PENYAJIAN DATA
Bab 3
Ringkasan Data
3.1
Ukuran Kecenderungan Pusat
Dalam keseharian kita sering mendengar ungkapan seperti:
• Umumnya orang Indonesia makan nasi.
• Sebagian besar siswa lulus UAN.
• Pendapatan per kapita rata-rata di Palangkaraya 4 juta rupiah per bulan.
Ungkapan-ungkapan tersebut merupakan ungkapan kecenderungan suatu keadaan.
Di dalam bagian ini kita akan meninjau dari sudut statistika cara menyapaikan
ungkapan-ungkapan tersebut.
Modus suatu data adalah nilai data yang paling banyak frekuensinya.
Contoh 9. Data banyaknya anak 10 rumah tangga adalah sebagai berikut:
2
0
2
1
2
3
4
3
2
1
Nilai data 2 memiliki frekuensi paling banyak, oleh karena itu modusnya adalah
2.
Median adalah nilai data yang posisinya ditengah setelah data diurutkan. Median data dapat dicari sebagai berikut:
1. Urutkan data dari nilai terkecil hingga terbesar.
2. Jika banyaknya nilai data ganjil, maka median = nilai yang posisinya
ditengah.
3. Jika banyaknya nilai data genap, maka
median =
jumlah dua nilai yang ditengah
.
2
15
16
BAB 3. RINGKASAN DATA
Contoh 10. Hasil pengukuran tinggi badan 11 mahasiswa (dalam kg) adalah
67
60
70
55
58
76
63
76
81
65
72
67
70
72
76
76
81
Setelah diurutkan maka menjadi
55
58
60
63
65
Karena banyaknya nilai data ada 11, maka mediannya adalah nilai yang posisinya ditengah, yaitu nilai ke 6. Dengan demikian mediannya adalah 67.
Contoh 11. Data pendapatan per bulan 10 orang adalah sebagai berikut
(dalam juta rupiah)
4
4
6
3
5
3
2
5
1
3
5
5
6
Setelah diurutkan, maka data tersebut menjadi
1
2
3
3
3
4
4
Karena banyaknya observasi 10 (genap), maka mediannya adalah
3+4
nilai ke 5 + nilai ke 6
=
= 3.5.
2
2
Mean atau mean aritmetika suatu sampel adalah jumlah seluruh nilai
data dibagi ukuran sampel. Mean suatu sampel berukuran n dengan nilai-nilai
data x1 , x2 , · · · , xn , ditulis x̄. Jadi
median =
n
mean = x̄ =
x1 + x2 + · · · + xn
1X
=
xi .
n
n i=1
Contoh 12. Nilai rapor semua pelajaran seorang siswa adalah 7, 8, 6, 7, 6, 8, 7, 9, 6, 7.
Mean nilai rapornya adalah
7+8+6+7+6+8+7+9+6+7
71
=
= 7.1.
10
10
Mean memiliki sifat sensitif terhadap nilai data ekstrim, dalam arti bahwa
jika terdapat nilai data yang sangat kecil atau sangat besar, maka mean mudah
berubah secara ekstrim.
x̄ =
Contoh 13. Data observasi tingkat penghasilan 10 orang di Palangkaraya per
bulan adalah sebagai berikut (dalam juta rupiah): 1, 3, 2, 4, 3, 100, 3, 4, 2, 4. Di
dalam contoh ini terdapat orang yang penghasilannya 100 juta per bulan. Mean
data ini adalah
1 + 3 + 2 + 4 + 3 + 100 + 3 + 4 + 2 + 4
= 12.6,
x̄ =
10
padahal umumnya ke 10 orang berpenghasilan dibawah 5 juta. Hal ini terjadi
karena ada nilai data yang ekstrim, yaitu 100.
Trimmed mean atau mean yang dipangkas relatif tidak sensitif terhadap nilai data ekstrim. Trimmed mean adalah mean suatu data yang telah
dipangkas sebagian data, umumnya digunakan pemangkasan 5 persen.
3.1. UKURAN KECENDERUNGAN PUSAT
17
Prosedur mencari trimmed mean 5 persen
1. Urutkan data dari nilai terkecil hingga nilai terbesar.
2. Hapus 5 persen bawah dan 5 persen atas data. Jika 5 persen tersebut
tidak menghasilkan bilangan bulat, bulatkan ke bilangan bulat terdekat.
3. Hitung mean 90 persen data yang tersisa.
Contoh 14. Data penghasilan per bulan 20 orang dalam juta rupiah adalah
sebagai berikut
3 2 3 1 4 5 4 6 3 5 4 100 4 5 7 8 4
Untuk mencari trimmed mean 5 persen pertama-tama data diurutkan
6
1 2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7
Banyaknya nilai data adalah 20, sehingga 5 persen dari 20 adalah 1.
Dihilangkan 5 persen (satu nilai data) bawah dan atas data menjadi
7
2 3 3 3 4 4 4 4 4 5 5 5 6 6
Mean yang dipangkas adalah mean data terakhir, yaitu
8
6
7
7
7
8
6
100
1
(2 + 3 + 3 + 3 + 4 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 6 + 6 + 6 + 7 + 7 + 8) = 4.78.
18
Kadang-kadang kita memiliki data yang nilainya dapat dikelompokan menjadi k nilai berbeda. Misalkan nilai data x1 , x2 , · · · , xk berturut-turut
memiliki
Pk
frekuensi f1 , f2 , · · · , fk . Ini berarti data ini memiliki n = i=1 fi nilai data
dengan nilai xi terjadi fi kali. Mean data demikian dapat dihitung sebagai
berikut
1
x̄ = (f1 x1 + f2 x2 + · · · + fk xk ).
n
dengan n = fi + f2 + · · · + fk .
x̄ =
Contoh 15. Berikut adalah data hasil observasi usia mahasiswa pada suatu
kelas
Usia
16
17
18
19
20
21
22
Frekuensi
2
4
7
8
6
3
2
Banyaknya observasi adalah n = 2 + 4 + 7 + 8 + 6 + 3 + 2 = 32. Mean data
tersebut adalah
1
605
x̄ =
(2 · 16 + 4 · 17 + 7 · 18 + 8 · 19 + 6 · 20 + 3 · 21 + 2 · 22) =
= 18.91.
32
32
18
BAB 3. RINGKASAN DATA
Kadang-kadang nilai data yang akan dicari meannya sangat besar. Untuk
mempermudah mencari mean data yang nilai-nilainya sangat besar dapat digunakan transformasi:
yi = xi − c
dengan c suatu konstanta.
Dengan tranfomasi tersebut, maka diperoleh
x̄ = ȳ + c.
Contoh 16. Suatu eksperimen untuk mengukur kecepatan cahaya menghasilkan
hasil pengukuran sebagai berikut (dalam km/detik):
300, 009
299, 999
299, 998
300, 099
300, 008.
Untuk mencari mean data tersebut dapat digunakan tranformasi
yi = xi − 300, 000,
dan diperoleh nilai-nilai yi :
9
−1
−2
99
8,
dan
1
(9 − 1 − 2 + 99 + 8) = 22.6.
5
Dengan demikian, mean hasil pengukuran kecepatan cahaya tersebut adalah
ȳ =
x̄ = ȳ + 300, 000 = 22.6 + 300, 000 = 300, 022.6.
3.2
Varian
Kita sering mendengar pernyataan seperti ”Tingkat pendapatan orang Indonesia sangat bervariasi”, ”Hasil nilai ujian nasional cukup beragam”, ”Tinggi tanaman padi di sawah sangat seragam”, dan sebagainya. Ungkapan semacam ini
merupakan suatu cara untuk menyatakan kecenderungan perbedaan antara individu.
Range data x1 , x2 , · · · , xn adalah selisih antara nilai data terbesar dan nilai
data terkecil.
Contoh 17. Nilai ujian 10 orang siswa adalah 5, 6, 4, 7, 8, 7, 10, 6, 7, 4.
Range data tersebut adalah 10 − 4 = 6.
Diketahui x1 , x2 , · · · , xn data sampel berukuran n dan x̄ mean data tersebut.
Deviasi nilai data xi terhadap mean x̄ adalah selisih antara xi dan x̄, yaitu
deviasi = xi − x̄.
3.3. PERSENTIL
19
Varian sampel, ditulis s2 , dari data x1 , x2 , · · · , xn didefinisikan
n
s2 =
1 X
(xi − x̄)2 .
n − 1 i=1
Varian sampel menggambarkan variabilitas data sampel. Jika s2 adalah varian
sampel, maka s dinamakan deviasi standar sampel.
Contoh 18. Hitunglah varian sampel setiap data berikut:
Data A: 5, 3, 4, 6, 2.
Data B: -2, -1, 11, 4, 8.
Mean data A adalah x̄ = (5 + 3 + 4 + 6 + 2)/5 = 4; dengan demikian varian
sampel data A adalah
1
(5 − 4)2 + (3 − 4)2 + (4 − 4)2 + (6 − 4)2 + (6 − 4)2 + (2 − 4)2
4
10
=
= 2.5,
4
√
dan deviasi standar data A adalah s = 2.5 = 1.58.
s2
=
Mean data B adalah x̄ = (−2 − 1 + 11 + 4 + 8)/5 = 4; dengan demikian
varian sampel data B adalah
1
(−2 − 4)2 + (−1 − 4)2 + (11 − 4)2 + (4 − 4)2 + (8 − 4)2
4
126
=
= 31.5
4
√
dan deviasi standar data B adalah s = 31.5 = 5.61.
s2
=
Perhatikan bahwa meskipun data A dan data B memiliki mean sama, namun
variannya berbeda. Varian data B lebih besar dibanding varian data A, yang
berarti bahwa data B lebih bervariasi dibanding data A.
3.3
Persentil
Diketahui bilangan p dengan 1 ≤ p ≤ 99. Persentil ke p dari suatu data adalah
suatu nilai sehingga p persen data berada pada atau dibawah nilai tersebut dan
(100 − p) persen data berada pada atau di atas nilai tersebut.
Quartil adalah persentil yang membagi data menjadi empat.
1. Quartil pertama ditulis Q1 , adalah persentil ke 25 .
2. Quartil kedua ditulis Q2 , adalah median.
20
BAB 3. RINGKASAN DATA
3. Quartil ketiga ditulis Q3 adalah persentil ke 75.
Prosedur mencari quartil:
1. Urutkan data dari nilai terkecil sampai dengan nilai terbesar
2. Posisi Q1 = 0.25(n + 1).
3. Posisi Q2 = 0.5(n + 1)
4. Posisi Q3 =0.75(n+1).
Interquartil = Q3 − Q1 .
Contoh 19. Data hasil ujian 40 mahasiswa
78
60
68
67
60
76
87
58
45
65
95
78
65
60
54
65
80
55
67
89
95
54
58
85
40
75
87
76
40
84
56
68
46
48
43
64
55
58
56
60
Setelah data diurutkan maka diperoleh :
Posisi Q1 = 0.25(40 + 1) = 10.25.
Q1
=
=
nilai ke 10 + 0.25( nilai ke 11 − nilai ke 10)
55 + 0.25 = 55.25.
Posisi Q2 = 0.5(40 + 1) = 20.5
Q2
=
=
nilai ke 20 + nilai ke 21
2
64 + 65
= 64.5.
2
Posisi Q3 = 0.75(40 + 1) = 30.75
Q3
=
=
nilai ke 30 + 0.75( nilai ke 31 − nilai ke 30)
76 + 0.75(78 − 76) = 77.50.
Interquartil=Q3 − Q1 = 77.50 − 55.25 = 22.5.
3.4. BOX PLOT
3.4
21
Box Plot
Quartil bersama dengan nilai data terbesar dan terkecil menghasilkan ringkasan
limabilangan dan sebaran data. Kelima bilangan yaitu:
nilai data terkecil, Q1 , median, Q3 dan nilai data terbesar.
Kelima bilangan dapat digunakan untuk membuat sketsa grafik data yang
dinamakan box plot.
Prosedur membuat box plot:
1. Gambarkan sebuah skala vertikal yang dapat mencakup nilai data terkecil
dan nilai data terbesar.
2. Gambarkan sebuah kotak dari Q1 ke Q3 di sebelah kanan skala tersebut.
3. Berilah garis mendatar pada kotak tersebut di ketinggian median.
4. Gambarkan garis vertikal dari Q1 ke nilai data terkecil dan dari Q3 ke
nilai data terbesar.
Contoh 20. Grafik box-plot data hasil ujian 40 mahasiswa pada contoh terdauhulu.
22
3.5
BAB 3. RINGKASAN DATA
Teorema Chebyshev
Teorema 1. Diketahui x̄ dan s berturut-turut adalah mean sampel dan deviasi
standar sampel dengan s > 0. Jika k ≥ 1 maka setidaknya 100(1 − 1/k 2 ) persen
data berada di dalam interval x̄ − ks sampai dengan x̄ + ks.
Contoh 21. Jika k = 2 maka setidaknya ada 100(1 − 1/22 ) = 100 · 3/4 = 75
persen data berada di dalam interval x̄ − 2s sampai dengan x̄ + 2s.
Contoh 22. Nilai ujian 20 siswa adalah sebagai berikut:
5 7 6 8 6 5 4 8 9 9 7 8 5 4 6 7 6 8
Dari data tersebut diperoleh: x̄ = 6.55 dan s = 1.5035.
Jika k = 3/2, maka setidaknya ada
6
7.
100(1 − 1/(3/2)2 ) = 100 · 5/9 = 55.55
3
1.5035 sampai dengan 6.55 +
persen
data
berada
di
dalam
interval
6.55
−
2
3
2 1.5035.
Dengan kata lain setidaknya 55.55 persen data berada di dalam interval 4.29475
sampai dengan 8.8052.
Dapat diperiksa bahwa nilai data yang berada di dalam interval tersebut adalah
5
7
6
8
6
5
8
7
8
8
6
7
6
8
7,
yaitu ada 15 (lebih dari 55.55 persen) nilai data yang berada di dalam interval
tersebut.
Bab 4
Peluang
4.1
Ruang Sampel
Suatu eksperimen dilaksanakan dengan tujuan untuk memperoleh hasil (outcome). Eksperimen random adalah suatu eksperimen yang dapat dilakukan
berkali-kali pada kondisi yang sama dan hasilnya tidak dapat ditentukan dengan pasti sebelum eksperimen tersebut selesai. Ini berarti hasil yang akan terjadi
dari suatu eksperimen random menganndung suatu ketidakpastian. Meskipun
hasilnya tidak dengan secara pasti dapat ditentukan, namun kita masih dapat
menentukan semua hasil yang mungkin terjadi.
Definisi 6. Ruang sampel, ditulis S, dari suatu eksperimen random adalah
himpunan semua hasil (outcome) yang mungkin terjadi.
Definisi 7. Pertistiwa E adalah himpunan bagian dari ruang sampel S. Peristiwa E dikatakan terjadi, jika E memiliki anggota.
Selanjutnya peristiwa akan dituliskan dangan huruf A, B, C, D, E, F dan sebagainya.
Definisi 8. Peristiwa E ∩ F adalah peristiwa terjadinya E dan F .
Peristiwa E c adalah peritstiwa tidak terjadinya E.
Dua peristiwa E dan F dikatakan saling saling jika E ∩ F = ∅, yakni jika kedua
peristiwa tidak memiliki anggota bersama.
23
24
BAB 4. PELUANG
Definisi 9. Peristiwa elementer adalah peristiwa yang memiliki tepat satu
anggota.
Contoh 23. Suatu eksperimen random melontarkan dua mata uang logam satu
kali. Peristiwa yang diamati adalah sisi yang menghadap ke atas.
Jika sisi angka ditulis a dan sisi gambar ditulis g, maka ruang sampelnya adalah
S = {aa, ag, ga, gg}.
Jika E adalah peristiwa terjadinya sisi a tepat satu kali, maka dapat ditulis
E = {ag, ga}.
Jika F peristiwa terjadinya sisi gambar setidaknya satu kali, maka dapat ditulis
F = {ag, ga, gg}.
Peristiwa E ∩ F berarti peristiwa terjadi sisi angka sebanyak satu kali dan
gambar satu kali, yaitu
E ∩ F = {ag, ga}.
Peristiwa E c menyatakan peristiwa tidak terjadinya E, yaitu tidak munculnya
sisi angka sebanyak satu kali, dan dapat ditulis
E c = {gg, aa}.
Contoh 24. Sebuah dadu dilontarkan satu kali dan diamati banyaknya spot
sisi yang menghadap ke atas.
Ruang sampelnya dapat ditulis
S = {1, 2, 3, 4, 5, 6}.
Peristiwa elementernya adalah {1}, {2}, {3}, {4}, {5} dan {6}.
Jika A peristiwa terjadinya sisi genap dan B peristiwa terjadinya sisi ganjil,
A = {2, 4, 6}
B = {1, 3, 5}
maka A dan B merupakan peristiwa yang saling asing, karena A ∩ B = ∅.
Contoh 25. Satu mata uang logam dilontarkan tiga kali.
Ruang sampelnya adalah
S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}.
Jika E adalah peristiwa munculnya sisi angka paling banyak satu kali, maka
dapat ditulis
E = {agg, gag, gga, ggg}.
4.2. PELUANG
25
Jika F adalah peristiwa munculnya sisi gambar satu kali, maka dapat ditulis
F = {aag, aga, gaa}.
Peristiwa E ∪ F adalah peristiwa munculnya sisi angka paling banyak satu kali
atau peristiwa munculnya sisi gambar dua kali. Jadi
E ∪ F = {agg, gag, gga, ggg, aag, aga, gaa}.
Contoh 26. Sebuah dadu dilontarkan dua kali. Pasangan (a, b) menyatakan
sisi yang muncul pada lontaran a dan pada lontaran kedua b. Ruang sampelnya
adalah
S
={
(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),
(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}
Jika E peristiwa munculnya jumlah kedua lontaran 10, maka dapat ditulis
E = {(4, 6), (5, 5), (6, 4)}.
Jika F peristiwa munculnya lontaran pertama spot 4, maka dapat ditulis
F = {(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)}.
Contoh 27. Misalkan kita ingin meramalkan ketinggian sebuah roket yang
ditembakan dari permukaan bumi. Ruang sampelnya adalah semua bilangan
pada interval 0 sampai dengan tak hingga,
S = {x : 0 ≤ x < takhingga}.
Jadi ruang sampel ini memiliki tak hingga anggota.
4.2
Peluang
Di dalam suatu percobaan random, akan terjadinya suatu peristiwa tidak dapat ditentukan secara pasti. Tingkat kepastian atau ketidakpastian ini diukur
dengan suatu ukuran yang dinamakan peluang (probability).
26
BAB 4. PELUANG
Definisi 10. (Pendekatan klasik peluang) Diketahui peristiwa E dapat terjadi
dalam h cara berbeda dari seluruh n cara yang semuanya memiliki kemungkinan
sama. Peluang peristiwa E, ditulis P (E), adalah
P (E) =
h
.
n
Pengertian peluang secara klasik mengandung arti bahwa setiap peristiwa
elementer memiliki peluang yang sama, yaitu sebesar N1 .
Contoh 28. Sebuah mangkok berisi 5 bola merah dan 4 bola biru. Dari
mangkok tersebut diambil tanpa pilih-pilih sebuah bola. Peluang terambilnya
bola merah adalah
5
P (merah) = ,
9
dan peluang terambilnya bola biru adalah
P (biru) =
4
.
9
Definisi 11. (Pendekatan frekuensi) Jika setelah diulang n percobaan, dengan
n besar, suatu peristiwa diketahui terjadi h kali, maka peluang peristiwa tersebut
adalah h/n.
Contoh 29. Jika satu mata uang logam dilontarkan 1000 kali dan diperoleh sisi
gambar terjadi 512 kali, maka peluang terjadinya sisi gambar adalah 512/1000 =
0.512.
Pada kenyataannya tidak semua peristiwa elementer memiliki peluang yang
sama, misalnya peluang sebuah mesin jet macet tentu tidak sama dengan peluang mesin tersebut tidak macet. Oleh karena itu pengertian klasik peluang
kurang tepat untuk berbagai fenomena yang terjadi sehari-hari.
Perhatikan bahwa pada pengertian klasik, banyaknya anggota ruang sampel
berhingga. Pada kenyataannya ada ruang sampel yang jumlah anggotanya
tak hingga. Ini berarti pengertian klasik peluang tidak dapat digunakan jika
banyaknya anggota ruang sampel tak hingga.
Definisi 12. Diketahui S ruang sampel. Untuk setiap peristiwa E bagian S
dihubungkan dengan suatu bilangan yang ditulis P (E) yang memenuhi sifatsifat berikut:
4.2. PELUANG
27
1. 0 ≤ P (E) ≤ 1.
2. P (S) = 1.
3. P (E1 ∪E2 ∪E3 ∪· · · ) = P (E1 )+P (E2 )+P (E3 )+· · · , dengan E1 , E2 , E3 , · · ·
adalah peristiwa yang saling asing.
Jika P memenuhi ketiga sifat, maka P dinamakan peluang, dan P (E) dinamakan peluang terjadinya peristiwa E.
Sifat (1) menyatakan bahwa peluang suatu peristiwa adalah suatu nilai numerik yang besarnya dari 0 hingga 1.
Sifat (2) menyatakan bahwa perstiwa terjadinya ruang sampel adalah pasti.
Sifat (3) menyatakan bahwa peluang gabungan peristiwa yang saling asing sama
dengan jumlah peluang masing-masing peristiwa.
Peluang merupakan ukuran numerik kemungkinan terjadinya suatu peristiwa. Nilai peluang yang mendekati satu berarti semakin besar kemungkinan
persistiwa tersebut terjadi. Sebaliknya jika peluang suatu peristiwa pendekati
nilai nol, berarti semakinkecil kemungkinan peristiwa tersebut terjadi. Jika suatu peristiwa memiliki peluang 1 artinya peristiwa tersebut pasti terjadi, sedangkan jika suatu peristiwa memiliki peluang 0 artinya peristiwa tersebut tidak
mungkin terjadi.
Contoh 30. Frekuensi relatif pada contoh merupakan peluang. Pada kolom
tersebut nilai frekiensi relatif berada pada interval 0 hingga 1, jumlah semua
frekuensi relatif adalah 1 dan frekuensi relatif gabungan kelas interval sama
dengan jumlah frekuensi relatif kelas interval.
Contoh 31. Tiga mata uang dilontarkan satu kali dan diamati sisi yang menghadap ke atas. Ruang sampelnya adalah
S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}.
Dianggap setiap peristiwa elementer memiliki peluang sama, yaitu 18 . Jika E
menyatakan peristiwa terjadinya sisi angka satu kali dan F menyatakan peristiwa terjadinya sisi gambar paling sedikit dua kali, maka E dan F dapat dituliskan
E = {agg, gga, gag} dan F = {ggg, gga, gag, agg}.
P (E)
= P (agg, gga, gag)
= P (agg) + P (gga) + P (gag)
= 81 + 18 + 18
= 83 .
(4.1)
28
BAB 4. PELUANG
P (F )
= P (ggg, gga, gag, agg)
= P (ggg) + P (gga) + P (gag) + P (agg)
= 18 + 81 + 18 + 81
= 12 .
(4.2)
Contoh 32. Sebuah mangkok berisi 10 kelereng merah, 30 kelereng putih, 25
kelereng biru dan 15 kelereng orange. Akan diambil satu kelereng. Berapa
peluang terambilnya kelereng
(a) putih
(b) orange atau merah
(c) bukan biru
(d) merah, putih atau biru
(e) bukan merah dan bukan biru
Penyelesaian: Misalkan M, P, B dan O berturut-turut menyatakan kelereng
warna merah, putih, biru dan orange. Banyaknya seluruh kelereng adalah 10 +
30 + 25 + 15 = 80.
(a) P (P ) =
30
80
= 0.375.
(b) P (O ∪ M ) =
15+10
80
= 0.3125.
(c) P (B c ) = 1 − P (B) = 1 −
(d) P (M ∪ P ∪ B) =
20
75
10+30+25
80
= 1 − 0.3125 = 0.6875.
= 0.8125.
(e) P (M c ∩ B c ) = P ((M ∪ B)c ) = 1 − P (M ∪ B) = 1 −
4.3
10+25
80
= 0.5625.
Peluang Bersyarat
Dalam suatu eksperimen random peluang terjadinya suatu peristiwa bisa tergantung terjadinya peristiwa lain. Sebagi contoh, peluang lahirnya anak kedua
perempuan bisa tergantung apakah anak pertama laki-laki atau perempuan.
Diketahui E dan F adalah peristiwa. Peluang terjadinya E jika diketahui peristiwa F telah terjadi dinamakan peluang bersyarat (conditional probability),
dituliskan P (E|F ), dan didefinisikan
P (E|F ) =
P (E ∩ F )
.
P (F )
Contoh 33. Sebuah mata uang logam dilontarkan dua kali, dan peluang setiap
peristiwa elementer sama. Berapa peluang terjadinya sisi a pada lontaran kedua
jika diketahui pada lontaran pertama sisi g telah terjadi?
Misalkan E peristiwa terjadinya sisi a pada lontaran kedua dan F peristiwa
4.3. PELUANG BERSYARAT
29
terjadinya sisi g pada lontaran pertama. Jadi E = {aa, ga} dan F = {gg, ga}.
Peluang yang dicari adalah
P (E|F ) =
P (E ∩ F )
P (ga)
1/4
1
=
=
= .
P (F )
P (gg, ga)
2/4
2
Contoh 34. Suatu mangkok berisi tujuh bola hitam dan lima bola putih. Diambil dua bola dari dalam mangkok tersebut dan bola yang telah terambil tidak
dikembalikan kedalam mangkok. Anggap setiap bola memiliki peluang sama untuk terambil. Berapa peluang bola yang terambil keduanya adalah bola hitam.
Misalkan F dan E berturut-turut peristiwa bola pertama dan bola kedua adalah
hitam. Karena bola pertama yang terambil hitam, maka ada enam bola hitam
dan lima bola putih yang tersisa di dalam mangkok, dan dengan demikian
P (E|F ) =
Karena P (F ) =
7
12 ,
6
.
11
maka peluang terambilnya kedua bola hitam adalah
P (E ∩ F ) = P (F )P (E|F ) =
7 6
42
=
.
12 11
132
Contoh 35. Pada suatu perguruan tinggi, s25 persen mahasiswa gagal matematika, 15 persen mahaasiswa gagal fisika, dan 10 persen maha siswa gagal
matematika dan ilmu fisika. Seorang mahasiswa dipilih secara random.
(a) Jika ia gagal fisika, berapa peluang ia gagal matematika?
(b) Jika ia gagal matematika, berapa peluang ia gagal fisika?
(c) Berapa peluang ia gagal matematika atau gagal fisika?
Penyelesaian: Tuliskan M = peristiwa mahasiswa yang gagal matematika,
F = persitiwa mahasiswa yang gagal fisika. Diperoleh
P (M ) = 0.25,
P (F ) = 0.15,
P (M ∩ F ) = 0.10
(a) Peluang ia gagal matematika, diketahui ia gagal fisikaa adalah
P (M |F ) =
P (M ∩ F )
0.10
2
=
=
P (F )
0.15
3
(b) Peluang ia gagal fisika, diketahui ia gagal matematika adalah
P (F ∩ M ) =
P (F ∩ M )
0.10
2
=
=
P (M )
0.25
5
(c) Peluang ia gagal matematika atau gagal fisika adalah
P (M ∪ F ) = P (M ) + P (F ) − P (M ∩ F ) = 0.25 + 0.15 − 0.10 = 0.30
30
BAB 4. PELUANG
Peristiwa E dan F dikatakan independen, jika peluang terjadinya peristiwa
E tidak tergantung apakah peristiwa F terjadi atau tidak terjadi. Dalam hal
ini P (E|F ) = P (E) dan berlaku
P (E ∩ F ) = P (E).P (F ).
Jadi peristiwa E dan F independen jika peluang terjadinya kedua peristiwa
bersamaan sama dengan hasil kali peluang terjadinya masing-masing peristiwa.
Contoh 36. Satu mata uang logam dilontarkan dua kali. Jika E peristiwa
munculnya sisi a pada lontaran pertama dan F peristiwa munculnya sisi g pada
lontaran kedua, yaitu
E = {aa, ag}
dan F = {ag, gg}.
Jika setiap peristiwa elementer memiliki peluang sama, maka
P (E ∩ F ) = P (ag) =
1
4
1 1
1
· = ,
2 2
4
sehingga P (∩F ) = P (E)P (F ), dengan kata lain E dan F adalah peristiwa yang
independen.
P (E)P (F ) = P (aa, ag)P (ag, gg) =
Contoh 37. Dua dadu dilontarkan satu kali. A menyatakan peristiwa munculnya jumlah spot kedua sisi adalah enam dan B menyatakan peristiwa munculnya
spot sisi dadu pertama empat. Diperoleh
P (A ∩ B) = P ({4, 2}) =
1
36
dan
5 1
5
· =
,
36 6
216
dan karena P (A ∩ B) 6= P (A)P (B), maka peristiwa A dan B tidak independen.
P (A)P (B) =
Peristiwa E1 , E2 , · · · , En dikatakan independen, jika untuk setiap r ≤ n
berlaku
P (E10 ∩ E20 ∩ · · · ∩ Er ) = P (E10 ) · P (E20 ) · · · P (Er ).
Bab 5
Variabel Random
Dalam suatu eksperimen random dapat terjadi peneliti tidak tertarik pada outcomenya tetapi barangkali lebih tertarik pada nilai numerik yang berkaitan dengan outcome tersebut. Misalnya dalam percobaan melontarkan tiga mata uang
sekali, mungkin peneliti lebih tertarik untuk mengamati banyaknya suatu sisi
terjadi dari pada mengamati sisi apa saja yang menghadap ke atas.
Definisi 13. Variabel random adalah suatu fungsi yang domainnya ruang sampel dan nilainya bilangan real. Selanjutnya variabel random ditulis dengan notasi X. Jika c adalah peristiwa elementer, maka nilai variabel random X di c
ditulis X(c). Jika nilai X(c) adalah x maka ditulis X(c) = x.
Contoh 38. Dua mata uang logam dilontarkan satu kali. Jika X menyatakan
banyaknya sisi a terjadi, maka X merupakan variabel random. Nilai variabel
random pada setiap anggota ruang sampel adalah sebegai berikut:
X(gg) = 0,
5.1
X(ag) = 1,
X(ga) = 1,
X(aa) = 2.
Variabel Random Diskrit
Variabel random X dikatakan variabel random diskrit jika nilai variabel random tersebut terhitung, yakni banyaknya nilai berhingga atau dapat dituliskan
sebagai
x1 , x2 , x3 , · · · .
Pada Contoh 38, X merupakan variabel random diskrit. .
31
32
BAB 5. VARIABEL RANDOM
Contoh 39. Tiga mata uang dilontarkan satu kali. Jika variabel random X
menyatakan banyaknya sisi angka terjadi, maka nilai-nilai X adalah
X(ggg) = 0
X(aaa) = 3
X(agg) = X(gag) = X(gga) = 1
X(aag) = X(aga) = X(gaa) = 2
Contoh 40. Dua dadu dilontarkan satu kali. Variabel random X menyatakan
banyaknya jumlah bintik kedua sisi yang menghadap ke atas. Nilai-nilai variabel
random X aadalah
X((1, 1)) = 2
X((2, 1)) = 3
X((3, 1)) = 3
X((4, 1)) = 5
X((5, 1)) = 6
X((6, 1)) = 7
X((1, 2)) = 3
X((2, 2)) = 4
X((3, 2)) = 5
X((4, 2)) = 6
X((5, 2)) = 7
X((6, 2)) = 8
X((1, 3)) = 4
X((2, 3)) = 5
X((3, 3)) = 6
X((4, 3)) = 7
X((5, 3)) = 8
X((6, 3)) = 9
X((1, 4)) = 5
X((2, 4)) = 6
X((3, 4)) = 7
X((4, 4)) = 8
X((5, 4)) = 9
X((6, 4)) = 10
X((1, 5)) = 6
X((2, 5)) = 7
X((3, 5)) = 8
X((4, 5)) = 9
X((5, 5)) = 10
X((6, 5)) = 11
Jika X variabel random diskrit, maka peluang variabel random X bernilai x
ditulis P (X = x). Pada Contoh 39 misalnya, variabel random X bernilai 2 jika
dan hanya jika peristiwa {aag}, {aga} dan {gaa} terjadi. Ini berarti peluang
X = 2 sama dengan peluang terjadinya peristiwa {aag, aga, gaa}, sehingga
diperoleh
P (X = 2) = P ({aag, aga, gaa}) =
3
.
8
Perhatikan bahwa nilai P (X = x) tergantung pada peristiwa yang dikaitkan
dengan nilai variabel random x. Dengan demikian peluang variabel random X
bergantung pada nilai x, dengan kata lain P (X = x) merupakan fungsi dari x.
Oleh karena itu dapat dituliskan
f (x) = P (X = x).
Selanjutnya f (x) dinamakan fungsi peluang atau distribusi peluang variabel random X.
Contoh 41. Pada Contoh 39, distribusi peluangnya adalah
f (0) = P (X
f (1) = P (X
f (2) = P (X
f (3) = P (X
= 0) = P (ggg) = 81
= 1) = P (agg, gag, gga) =
= 2) = P (aag, aga, gaa) =
= 3) = P (aaa) = 18
3
8
3
8
X((1, 6)) = 7
X((2, 6)) = 8
X((3, 6)) = 9
X((4, 6)) = 10
X((5, 6)) = 11
X((6, 6)) = 12
5.1. VARIABEL RANDOM DISKRIT
33
Contoh 42. Pada Contoh 40, distribusi peluangnya adalah
f (2)
f (3)
f (4)
f (5)
f (6)
f (7)
f (8)
f (9)
f (10)
f (11)
f (12)
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
1
= 2) = P ((1, 1)) = 36
2
= 3) = P ((1, 2)(2, 1)) = 36
3
= 4) = P ((1, 3), (2, 2), (3, 1)) = 36
4
= 5) = P ((1, 4), (2, 3), (3, 2), (4, 2)) = 36
5
= 6) = P ((1, 5), (2, 4), (3, 3), (4, 2), (5, 1)) = 36
= 7) = P ((1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) =
5
= 8) = P ((2, 6), (3, 5), (4, 4), (5, 3), (6, 2)) = 36
4
= 9) = P ((3, 6), (4, 5), (5, 4), (6, 3)) = 36
3
= 10) = P ((4, 6), (5, 5), (6, 4)) = 36
2
= 11) = P ((5, 6), (6, 5)) = 36
= 12) = P ((6, 6)) = 16
6
36
Fungsi distribusi kumulatif atau fungsi distribusi, ditulis F (x), adalah
peluang variabel random X bernilai lebih kecil atau sama dengan x. Jadi
F (x) = P (X ≤ x).
Contoh 43. Perhatikan kembali Contoh 39. Distribusi kumulatifnya dalah
F (0) = P (x ≤ 0) = P (X
F (1) = P (x ≤ 1) = P (X
F (2) = P (x ≤ 2) = P (X
F (3) = P (x ≤ 3) = P (X
= 0) = 81
= 0) + P (X = 1) = 12
= 0) + P (X = 1) + P (X = 2) = 78
= 0) + P (X = 1) + P (X = 2) + P (X = 3) = 1
34
BAB 5. VARIABEL RANDOM
Contoh 44. Distribusi kumulatif pada Contoh 40 adalah
F (2)
F (3)
F (4)
F (5)
F (6)
F (7)
=
=
=
=
=
=
=
F (8)
=
P (x ≤ 2) = P (X
P (x ≤ 3) = P (X
P (x ≤ 4) = P (X
P (x ≤ 5) = P (X
P (x ≤ 6) = P (X
1
= 2) = 36
= 2) + P (X
= 2) + P (X
= 2) + P (X
= 2) + P (X
3
= 3) = 36
6
= 3) + P (X = 4) = 36
= 3) + P (X = 4) + P (X = 5) = 10
36
= 3) + P (X = 4) + P (X = 5) + P (X = 6)
15
36
P (x ≤ 7) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) = 21
36
P (x ≤ 8) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) =
26
36
P (x ≤ 9) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) + P (X = 9) = 30
36
F (10) = P (x ≤ 10) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) = 33
36
F (11) = P (x ≤ 11) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
35
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) = 36
F (12) = P (x ≤ 12) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) + P (X = 12)
= 36
36 = 1.
F (9)
=
5.2. NILAI HARAPAN VARIABEL RANDOM DISKRIT
5.2
35
Nilai Harapan Variabel Random Diskrit
Nilai harapan suatu variabel random menggambarkan nilai yang diharapkan
akan terjadi dari suatu eksperimen random atau kecenderungan hasil yang akan
terjadi.
Definisi 14. Nilai harapan suatu variabel random diskrit ditulis E(X) atau µ,
didefinisikan sebagai berikut
X
µ = E(X) =
xi .P (X = xi ),
Contoh 45. Pada percobaan melontarkan dua mata uang logam sebanyak satu
kali (Contoh 38), diperoleh
P (X = 0) =
1
4
P (X = 1) =
1
2
dan P (X = 2) =
1
.
4
Dengan demikian nilai harapannya adalah
µ = E(X)
= 0 · P (X = 0) + 1 · P (X = 1) + 2 · P (X = 2)
= 0 · 14 + 1 · 12 + 2 · 14 = 1.
Karena µ adalah nilai harapan variabel random X, maka X − µ merupakan
deviasi X terhadap nilai harapannya. Ukuran yang menggambarkan variabilitas
suatu variabel random didefinisikan berikut.
Definisi 15. Varian variabel random diskrit X ditulis V ar(X) atau σ 2 adalah
X
σ 2 = V ar(X) = E((X − µ)2 ) =
(xi − µ)2 .P (X = xi ),
Kuantitas σ =
√
σ 2 dinamakan deviasi standar.
Berdasarkan definisi di atas, V ar(X) merupakan nilai harapan kuadrat deviasi X − µ; dengan demikian V ar(X) ≥ 0. Semakin besar varian suatu variabel
random, semakin basar variabilitasnya. Nilai varian suatu variabel random
adalah 0 jika dan hanya jika variabel random tersebut nilainya tetap. tersebut
Contoh 46. Varian pada Contoh 38 di atas adalah
σ 2 = V ar(X)
= (0 − 1)2 .P (X = 0) + (1 − 1)2 .P (X = 1) + (2 − 1)2 .P (X = 2)
= 41 + 0 + 2. 14 = 0.5.
√
Deviasi standarnya adalah σ = 0.5 = 0.7.
36
5.3
BAB 5. VARIABEL RANDOM
Variabel Random Kontinu
Jika X adalah variabel random dengan peluang pada setiap titik tunggal x
sama dengan nol, yakni P (X = x) = 0, maka X dinamakan variabel random
kontinyu. Jika X variabel random kontinyu, maka ada fungsi f (x) sehingga
peluang variabel random X berada di antara a dan b sama dengan luas daerah
yang dibatasi oleh kurva f (x), sumbu x, garis x = a dan garis x = b. Selanjutnya peluang X berada di antara a dan b ditulis P (a < X < b). Fungsi f (x)
tersebut dinamakan fungsi kepadatan peluang.
Fungsi distribusi kumulatif variabel random kontinyu X, ditulis F (x),
didefinisikan sebagai peluang variabel random X bernilai lebih kecil atau sama
dengan x atau
F (x) = P (X < x)
Contoh 47. Diketahui variabel random kontinyu X memiliki fungsi densitas
f (x) = 51 dengan 0 ≤ x ≤ 5. Peluang variabel random X berada antara 1 dan
3 adalah
2
P (1 ≤ X ≤ 3) = ,
5
dan distribusi kumulatif di x = 2.5 adalah
1
F (2.5) = .
2
5.4
Variabel Random Bersama
Di dalam suatu penelitian, kita sering tertarik pada dua variabel random atau
lebih. Misalnya dalam meneliti tentang penyakit jantung, mungkin kita tertarik
pada beberapa faktor penyebab seperti kebiasaan merokok dan konsumsi alkohol.
Diketahui dua variabel random X dan Y . Untuk menggabungkan kedua variabel dapat kita gunakan fungsi distribusi kumulatif.
Definisi 16. Diketahui variabel random X dan Y . Fungsi distribusi kumulatif bersama F (x, y) adalah
F (x, y) = P (X ≤ x, Y ≤ y).
Berdasarkan definisi di atas, fungsi distribusi kumulatif bersama adalah peluang variabel random X ≤ x dan Y ≤ y terjadi bersama-sama.
Diketahui X dan Y masing-masing variabel random disktrit. Peluang variabel random X bernilai x dan variabel random Y bernilai y ditulis P (X =
x, Y = y). Variabel random X dan Y dikatakan independen jika berlaku
P (X = x, Y = y) = P (X = x).P (Y = y)
5.4. VARIABEL RANDOM BERSAMA
37
Dua variabel random kontinyu X dan Y dikatakan independent jika peluang
terjadinya X tidak dipengaruhi apakah variabel random Y terjadi atau tidak.
Jika f (x, y) fungsi densitas variabel random kontinyu X dan Y dan kedua variabel random independen, maka berlaku
f (x, y) = f1 (x).f2 (y),
dimana f1 (x) dan f2 (y) berturut-turut fungsi densitas X dan Y .
38
BAB 5. VARIABEL RANDOM
Bab 6
Beberapa Distribusi
Peluang
Pada bagian ini akan disampaikan beberapa distribusi peluang variabel random
diskrit dan kontinyu yang banyak digunakan didalam inferensi statistik.
6.1
Distribusi binomial
Misalkan suatu eksperimen random hanya memiliki dua hasil yang mungkin,
hasil pertama dinamakan sukses dan hasil kedua dinamakan gagal. Eksperimen tersebut diulang secara independen sebanyak n kali. Jika peluang sukses setiap eksperimen adalah sama sebesar p maka peluang gagal pada setiap
eksperimen adalah p−1. Jika X menyatakan banyaknya sukses dari n percobaan
(trial) dan peluang X = x diberikan oleh fungsi peluang berikut
P (X = x) =
n x
p (1 − p)n−x ,
x
x = 0, 1, 2, 3, · · · , n,
(6.1)
maka X dinamakan berdistribusi binomial dengan parameter n dan p.
Selanjutnya dapat dibuktikan bahwa nilai harapan dan varians disrtibusi binomial adalah
µ = np dan σ 2 = np(1 − p)
(6.2)
n
Di dalam fungsi peluang binomial, notasi x menyatakan kombinasi x objek
dari n objek, yaitu
n
n!
=
,
(6.3)
x
x!(n − x)!
dengan n! = 1 · 2 · 3 · · · (n − 1) · n dan 0! = 1.
Contoh variabel random berdistribusi binomial adalah melontarkan mata
uang logam, cacat tidaknya suatu produk dan macet tidaknya suatu mesin jet.
39
40
BAB 6. BEBERAPA DISTRIBUSI PELUANG
Contoh 48. Diketahui suatu telur asin yang diproduksi suatu perusahaan
memiliki peluang rusak 0.01 dan bersifat independen terhadap telor asin lainnya.
Jika diambil secara random sampel sebanyak 5 telor asin, (a) berapa peluang
telor asin yang rusak sebanyak satu? (b) berapa peluang telor asin yang rusak
paling banyak satu?
Jika X menyatakan banyaknya telor asin yang rusak, maka X merupakan variabel random binomial dengan n = 5 dan p = 0.01. Dengan demikian
(a) Peluang telor asin yang rusak sebanyak satu adalah
5
P (X = 1) =
(0.01)1 (1 − 0.01)4 = 0.04803.
1
(b) Peluang telor asin yang rusak paling banyak satu adalah
P (X ≤ 1)
6.2
=
P (X = 0) + P (X = 1)
5
5
0
5
=
(0.01) (1 − 0.01) +
(0.01)1 (1 − 0.01)4
0
1
= 0.95099 + 0.04803 = 0.99902.
Distribusi Normal
Variabel random X dikatakan berdistribusi normal dengan mean µ dan varian
σ 2 jika fungsi densitasnya diberikan oleh
f (x) =
2
2
1
√ e−(x−µ) /2σ ,
σ 2π
(6.4)
dengan π = 2, 1415... dan e = 2, 718282....
Contoh variabel random yang berdistribusi normal adalah diameter lubang yang
dihasilkan mesin bor, skor suatu test, konsentrasi suatu bahan kimia pada suatu
jenis obat, dan hasil panen pada suatu lahan.
Jika mean µ = 0 dan deviasi σ = 1, maka X dinamakan berdistribusi normal standar. Grafik distribusi normal standar disajikan pada gambar 6.1,
yakni berupa kurva yang simetris terhadap garis z = 0. Pada grafik ini sumbu
horisontal z merupakan nilai variabel random dan sumbu vertikal merupakan
nilai fungsi densitas f (z). Nilai maksimum grafik ini dicapai pada titik z = 0,
semakin jauh dari titik z = 0 semakin kecil nilai fungsi ini dan akan mendekati
nol jika nilai z mendekatai tak hingga atau mendekati minus tak hingga.
Jika variabel random X berdistribusi normal standar, maka distribusi kumulatifnya dituliskan dengan notasi Φ(x); jadi
Φ(x) = P (X ≤ x)
(6.5)
6.2. DISTRIBUSI NORMAL
41
0.4
0.3
0.2
0.1
z
−4
−2
2
4
Gambar 6.1: Kurva normal standar
x
Gambar 6.2: P (X ≤ x) = Φ(x)
Secara grafik, kurva fungsi densitas normal standar simetris terhadap garis
x = 0. Karena luas seluruhnya adalah 1, maka
Φ(0) = 0.5.
Luas daerah yang dibatasi oleh garis x = 0 dan x = a dengan luas daerah
42
BAB 6. BEBERAPA DISTRIBUSI PELUANG
0
Gambar 6.3: Φ(0) = 0.5
yang dibatasi x = 0 dan x = −a adalah sama. Dengan demikian berlaku
Φ(−x) = 1 − Φ(x).
−x
x
Gambar 6.4: Φ(−x) = 1 − Φ(x)
Untuk menghitung peluang variabel random X yang berdistribusi normal
standar dapat digunakan tabel normal standar. Peluang variabel random X
berada di antara a dan b, dengan a < b, sama dengan luas daerah di bawah
kurva normal yang dibatasi garis x = a dan x = b. Dengan demikian
P (a ≤ X ≤ b) = Φ(b) − Φ(a).
Contoh 49. Diketahui X berdistibusi normal standar. Hitunglah peluang (a)
X lebih kecil 1.94, (b) X terletak antara 0.5 dan 1.4, (c) X berada antara −1.1
dan 1.5.
(a) P (X < 1.94) = P (X ≤ 1.94) = Φ(1.94) = 0.9738.
6.3. DISTRIBUSI YANG BERHUBUNGAN DENGAN DISTRIBUSI NORMAL43
a
b
Gambar 6.5: P (a ≤ X ≤ b) = Φ(b) − Φ(a)
(b) P (0.5 ≤ X ≤ 1.4) = Φ(1.4) − Φ(0.5) = 0.9192 − 0.6915 = 0.2277.
(c) P (−1.1 ≤ X ≤ 1.5) = Φ(1.5) − Φ(−1.1) = Φ(1.5) − (1 − Φ(1.1)) =
0.9332 − (1 − 0.8643) = 0.7975.
6.3
6.3.1
Distribusi yang berhubungan dengan distribusi
normal
Distribusi Chi-Square
Jika variabel random X1 , X2 , X3 , · · · , Xr adalah r variabel independen yang
masing-masing berdistibusi normal standar, maka variabel random
χ2 = X12 + X22 + X32 + · · · + Xr2
(6.6)
berdistibusi dengan distribusi yang dinamakan distribusi Chi-square dengan
derajat bebas r.
Distribusi kumulatif χ2 dengan derajat bebas r ditulis P (χ2r ≤ x). Nilai batas
x untuk derajat bebas r dan distribusi kumulatif γ tertentu dapat dicari pada
suatu tabel yang dinamakan tabel Distribusi χ2 .
Contoh 50. Carilah x sehingga P (χ212 ≤ x) = 0.05.
Berdasarkan tabel dengan r = 12 dan γ = 0.05 diperoleh x = 5.226.
6.3.2
Distribusi t
Diketahui Y dan Z variabel random independen, dengan Y berdistribusi normal standar dan Z berdistribusi chi-square dengan derajat bebas r. Dapat
ditunjukan bahwa variabel random
44
BAB 6. BEBERAPA DISTRIBUSI PELUANG
Y
T =p
Z/r
(6.7)
memiliki distribusi yang dinamakan distribusi t dengan derajat bebas r.
Nilai distribusi kumulatif variabel random berditribusi t dengan derajat bebas
r ditulis P (tr ≤ x). Nilai x untuk derajat bebas r dan distribusi kumulatif γ
tertentu dapat dicari pada suatu tabel yang dinamakan tabel Distribusi t.
Contoh 51. Carilah x sehingga P (t10 ≤ x) = 0.99.
Berdasarkan tabel dengan r = 10 dan γ = 0.99 diperoleh x = 2.7638.
6.3.3
Distribusi F
Diketahui variabel random X dan Y berdistribusi chi-square dengan derajat
bebas berturut-turut r1 dan r2 . Dapat dibuktikan bahwa variabel random
F =
X/r1
Y /r2
(6.8)
memiliki suatu distribusi yang dinamakan distribusi F dengan derajat bebas r1 dan r2 . Dalam hal ini r1 disebut juga derajat bebas pembilang dan r2
disebut juga derajat bebas penyebut. Distribusi kumulatif F dengan derajat
bebas r1 dan r2 , ditulis P (Fr1 ,r2 ≤ x). Nilai x untuk r1 dan r2 tertentu dan
distribusi kumulatif γ tertentu telah dihitung dan ditabelkan pada suatu tabel
yang dinamakan tabel F .
Contoh 52. Carilah x sehingga P (F4,10 ≤ x) = 0.95.
Berdasarkan tabel dengan r1 = 4, r2 = 10 dan γ = 0.95 diperoleh x = 3.4780.
Bab 7
Teori Sampling
Di dalam aplikasi kita sering mengambil kesimpulan dari suatu kelompok individu atau populasi. Karena alasan tertentu, kita tidak mungkin untuk mengamati seluruh anggota populasi, namun hanya mengamati bagian dari populasi
yang dinamakan sampel. Inferensi statistik adalah pengambilan kesimpulan
berdasarkan sampel.
Jika X variabel random dengan distribusi F dan dilakukan percobaan random sebanyak n kali, maka diperoleh variabel random X1 , X2 , · · · , Xn . Selanjutnya X1 , X2 , · · · , Xn dinamakan sampel random dari distribusi F . Suatu
sampel dikatakan berukuran n jika banyaknya anggota sampel adalah n. Jika
nilai sampel random tersebut berturut-turut adalah x1 , x2 , · · · , xn , maka nilainilai ini dinamakan nilai eksperimen atau data sampel.
Suatu kuantitas yang dihitung dari data sampel dinamakan statistik, sedangkan suatu kauntitas yang dimiliki oleh suatu populasi dinamakan parameter.
Dapat terjadi nilai parameter suatu populasi diketahui atau tidak diketahui.
Contoh 53. Misalkan variabel random X menyatakan usia bola lampu yang
diproduksi suatu perusahaan yang diasumsikan berdistribusi normal dengan
mean µ dan varian σ 2 yang tidak diketahui. Satu-satunya cara untuk memperoleh informasi tentang µ dan σ 2 adalah dengan melakukan eksperimen random.
Misalkan dilakukan eksperimen dengan mengambil secara random sebanyak n =
100 bola lampu, dan usia bola lampu yang tercatat adalah X1 , X2 , X3 , · · · , X100 .
Dalam hal ini X1 , X2 , X3 , · · · , X100 merupakan sampel random yang berasal
dari distribusi normal tersebut. Ke 100 bola lampu tersebut dapat digunakan
untuk memperoleh informasi tentang µ dan σ 2 . Ukuran yang diperoleh dari ke
100 bola lampu tersebut merupakan statistik, sedangkan µ dan σ 2 merupakan
parameter.
Misalkan suatu populasi memiliki distribusi tertentu dengan mean populasi µ dan varian populasi σ 2 . Suatu sampel random X1 , X2 , · · · , Xn diambil
dari populasi tersebut. Ada dua statistik yang penting, yaitu mean sampel dan
45
46
BAB 7. TEORI SAMPLING
varian sampel.
Definisi 17. Diketahui X1 , X2 , X3 , · · · , Xn adalah sampel random berukuran
n.
(a) Mean sampel didefinisikan
n
X=
X Xi
X1 + X2 + · · · + Xn
=
n
n
i=1
(b) Varian sampel didefinisikan
S2 =
n
X
(Xi − X)2
i=1
dan S =
√
n−1
,
S 2 dinamakan deviasi standar sampel.
Contoh 54. Suatu eksperimen random telah dilakukan sebanyak 5 kali dan
diperoleh X1 = 3.5, X2 = 3.2, X3 = 3.4, X4 = 3.3 dan X5 = 3.6. Mean
sampelnya adalah
X=
5
X
Xi
i=1
5
=
3.5 + 3.2 + 3.4 + 3.3 + 3.6
= 3.4,
5
dan varian sampelnya adalah
S2
=
5
X
(Xi − X)2
i=1
5−1
(3.5 − 3.4)2 + (3.2 − 3.4)2 + (3.4 − 3.4)2 + (3.3 − 3.4)2 + (3.6 − 3.4)2
4
= 0.025.
√
Dengan demikian deviasi standar sampel adalah S = 0.025 = 0.158.
=
Distribusi sampel adalah distribusi peluang suatu statistik. Misalnya distribusi peluang X dinamakan distribusi sample mean.
Teorema 2. Jika X1 , X2 , · · · , Xn sampel random berukuran n dari suatu distribusi dengan mean µ dan varian σ 2 , maka nilai harapan X dan varian X
adalah
47
(a) E(X) = µ
(b) V ar(X) =
σ2
n .
Berdasarkan teorema di atas, nilai harapan X sama dengan mean populasi
µ, sedangkan varian X semakin mengecil dengan bertambahnya ukuran sampel
n.
Teorema 3 (Teorema Limit Pusat). Jika X adalah mean sampel random
berukuran n dari suatu populasi dengan mean µ dan varian σ 2 , maka
Z=
X −µ
√
σ n
mendekati berdistribusi normal standar jika n besar.
Umumnya Z mendekati distribusi normal untuk n ≥ 30. Teorema di atas
dapat digunakan untuk mencari nilai pendekatan peluang variabel random X̄.
Contoh 55. Suatu perusahan memproduksi bola lampu yang usia hidupnya
berdistribusi mendekati normal dengan mean 800 jam dan deviasi standar 40
jam. Berapa peluang suatu sampel random sebanyak 16 bola lampu akar berusia
rata-rata kurang dari 775 jam?
√
Distribusi sampel X mendekati normal dengan µX = 800 dan σX = 40/ 16 =
10. Peluang yang dicari adalah
775 − 800
X −µ
√ <
P (X < 775) = P
= P (Z < −2.5) = 0.0062.
10
σ n
Teorema 4. Jika X1 , X2 , · · · , Xn sampel random berukuran n dari suatu dis2
Pn
i −X)
triibusi dengan mean µ dan varian σ 2 , maka nilai harapan S 2 = i=1 (Xn−1
adalah
E(S 2 ) = σ 2 .
Teorema tersebut menyatakan bahwa nilai harapan dari varian sampel sama
dengan varian populasi.
Brikutnya akan dibahas distribusi statistik suatu sampel random yang berasal dari populasi berdistrusi normal. Jika X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi normal dengan mean µ dan varian σ, dan mean
48
BAB 7. TEORI SAMPLING
sampel X, maka
Z=
X −µ
√
σ/ n
berdistribusi normal standar.
Teorema 5. Jika X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi normal dengan mean µ dan varian σ, maka
(a) X dan S 2 independen
(b) X berdistribusi normal dengan mean µ dan varian σ 2 /n
(c) (n − 1)S 2 /σ 2 berdistribusi chi-square dengan derajat bebas n − 1.
Di dalam inferensi statistik, sering diasumsikan bahwa sampel random X1 , X2 , · · · , Xn
bersifat independen. Jika ukuran populai berhingga, maka tidak ada jaminan
sampel random tersebut independen. Namun jika ukuran populasi relatif besar
terhadap ukuran sampel, maka sampel random tersebut mendekati independen.
Bab 8
Estimasi
Jika kita telah memperoleh data sampel dari suatu populasi yang memiliki mean
µ yang tidak diketahui, maka untuk memperoleh informasi tentang parameter
µ dapat digunakan mean sampel x̄. Ini berarti statistik x̄ digunakan untuk
mengestimasi (meduga) parameter mean populasi µ. Dalam hal ini x̄ dinamakan
estimator (penduga) untuk µ. Secara umum, jika θ parameter populasi, maka
estimator untuk θ ditulis θ̂. Jadi µ̂ = x̄.
Estimator titik suatu parameter adalah estimator yang berupa sebuah nilai
tunggal. Sebagai contoh, dalam pernyataan ”rata-rata hasil pengukuran kecepatan cahaya adalah 301.000 km/detik”, nilai tersebut adalah suatu estimator
titik.
Definisi 18. Suatu statistik dikatakan estimator tak bias parameter θ jika nilai harapannya sama dengan θ. Jika tidak demikian maka statisik tersebut
dikatakan bias.
Pada kuliah sebelumnya telah disampaikan bahwa statistik
Pn
X=
i=1
Xi
n
memiliki nilai harapan sama dengan mean populasi µ. Dengan demikian X
merupakan estimator tak bias untuk parameter µ . Demikian pula varian sampel
S2 =
Pn
− X)2
n−1
i=1 (Xi
juga merupakan estimator tak bias parameter varian σ 2 .
49
50
BAB 8. ESTIMASI
Definisi 19. Suatu estimator θ1 dikatakan lebih efisien dari pada estimator θ2
jika varian θ1 lebih kecil dibanding varian θ2 .
Suatu estimator yang berupa interval dimana parameter diduga berada dinamakan estimator interval.
Sebagai contoh, jika dikatakan kecepatan cahaya berkisar antara 299.000 km/detik
sampai dengan 305.000 km/detik, maka nilai kecepatan cahaya yang sebenarnya
dipercaya berada di antara kedua batas interval.
Interval kepercayaan untuk suatu parameter adalah suatu inteval dalam
mana parameter dipercaya berada. Misalkan θ adalah parameter yang tidak
diketahui. Untuk membentuk interval kepercayaan θ, kita perlu mencari statistik U dan L sehingga peluang
P (L ≤ θ ≤ U ) = 1 − α
adalah benar. Interval
L≤θ≤U
(8.1)
dinamakan interval kepercayaan 100(1-α) persen untuk parameter θ.
Interval kepercayaan dapat diinterpretasikan sebagai berikut: jika kita mengambil sampel random berulang-ulang, maka 100(1−α) persen dari semua nilai data
akan memuat nilai θ yang sebenarnya.
Di dalam persamaan 8.1, L dan U berturut-turut dinamakan batas bawah dan
batas atas interval.
Jika α = 0.05 misalnya, maka persamaan 8.1 dinamakan interval kepercayaan
95 persen untuk θ. Pada bagian berikut, kita akan belajar membentuk interval
kepercayaan untuk paramter mean populasi µ, varian populasi σ 2 dan selisih
dua mean populasi.
8.1
Interval Kepercayaan untuk µ dengan σ Diketahui
Misalkan X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi normal dengan mean µ dan varian σ 2 . Telah disampaikan bahwa X merupakan
estimator µ. Namun demikian kita tidak dapat memastikan bahwa X = µ,
melainkan kita hanya dapat menyatakan bahwa µ berada di dalam interval tertentu.
Karena X berdistribusi normal dengan mean µ dan varian σ 2 /n, maka
X −µ
√
σ/ n
8.1. INTERVAL KEPERCAYAAN UNTUK µ DENGAN σ DIKETAHUI 51
berdistribusi normal standar. Oleh karena itu
√ (X − µ)
< 1.96 = 0.95
P −1.96 < n
σ
atau ekivalen dengan
σ
σ
P X − 1.96 √ < µ < X + 1.96 √
= 0.95
n
n
Interval
σ
σ
X − 1.96 √ , X + 1.96 √
n
n
dinamakan interval kepercayaan 95 persen untuk µ.
Jika x1 , x2 , · · · , xn adalah data sampel dari distribusi di atas, dan x adalah
rata-rata sampel, maka interval kepercayaan 95 persen untuk µ adalah
σ
σ
x − 1.96 √ , x + 1.96 √
.
n
n
Contoh 56. Dari data sampel random berat badan 100 orang dewasa di Palangkaraya
diperoleh x = 67.45 kg dan penelitian sebelumnya menyatakan bahwa σ 2 =
8.6136 kg. Carilasolh interval kepercayaan 95 persen berat badan orang dewasa
di Palangkaraya.
Penyelesaian. Berdasarkan yang diketahui, interval kepercayaan 95 persen untuk mean populasi adalah
2.93
√
=
67.45 − 1.96 √2.93
x − 1.96 √σn , x + 1.96 √σn
,
67.45
+
1.96
100
100
= (66.8748, 68.0252) .
Ini berarti 95 persen dapat dipercaya bahwa berat badan rata-rata orang dewasa
di Palangkaraya berada di antara (66.8748 kg sampai dengan 68.0252 kg.
Dengan cara yang serupa, interval kepercayaan 99 persen untuk mean populasi µ adalah
σ
σ
X − 2.58 √ , X + 2.58 √
.
n
n
Secara umum, interval kepercayaan (1 − α) persen untuk mean populasi µ
jika σ diketahui adalah
σ
σ
X − zα/2 √ , X + zα/2 √
.
n
n
Nilai zα/2 untuk beberapa tingkat kepercayaan yang sering digunakan adalah
52
BAB 8. ESTIMASI
Tingkat
kepercayaan
zα/2
99.73 %
99 %
98 %
96 %
95.45 %
95 %
90 %
3.00
2.58
2.33
2.05
2.00
1.96
1.645
Table 8.1: Tabel zα/2
8.2
Interval Kepercayaan untuk µ dengan σ Tidak
Diketahui
Misalkan X1 , X2 , · · · , Xn sampel random dari populasi berdistribusi normal
dengan µ dan σ 2 keduanya tak diketahui. Dapat dibuktikan bahwa
√
(X − µ) n
S
berdistribusi t dengan derajat bebas n − 1.
Interval kepercayaan (1 − α) persen untuk µ dapat dibentuk sebagai berikut.
√
(X − µ) n
P −tα/2,n−1 <
< tα/2,n−1 = 1 − α
S
atau ekivalen dengan
S
S
√
√
< µ < X + tα/2,n−1
= 1 − α.
P X − tα/2,n−1
n
n
Jadi jika X = x dan S = s, maka kita dapat menyatakan bahwa 100(1 − α)
persen percaya nilai µ berada di dalam interval
S
S
.
x − tα/2,n−1 √ , x + tα/2,n−1 √
n
n
Contoh 57. Berdasarkan data sampel random pengukuran 10 diameter pipa
menghasilkan mean x = 2.38 cm dan deviasi standar s = 0.06 cm. Carilah
interval kepercayaan 95 persen untuk diameter pipa yang sebenarnya.
Penyelesaian. Berdasarkan tabel t dengan α = 0.05 dan n = 10 diperoleh
t0.025,9 = 2.262. Interval kepercayaan 95 persen untuk diameter pipa yang
sebenarnya adalah
0.06
0.06
√
,
2.38
+
2.262
2.38 − 2.262 √
10
10
= (2.38 − 0.04292, 2.38 + 0.04292)
= (2.3371, 2.4229)
yang berarti bahwa 95 persen dapat dipercaya diameter pipa yang sebenarnya
antara 2.3371 dan2.4229.
8.3. INTERVAL KEPERCAYAAN UNTUK σ 2
8.3
53
Interval Kepercayaan untuk σ 2
Diketahui X1 , X2 , · · · , Xn sampel random dari populasi berdistribusi normal
dengan mean µ dan varian σ 2 yang tidak diketahui. Dapat dibuktikan bahwa
(n − 1)
S2
σ2
berdistribusi Chi-square dengan dejarat bebas n − 1.
Interval kepercayaan (1 − α) persen untuk σ 2 dapat dibentuk sebagai berikut.
S2
2
2
P χ1−α/2,n−1 < (n − 1) 2 < χα/2,n−1 = 1 − α
σ
atau ekivalen dengan
P
(n − 1)S 2
(n − 1)S 2
< σ2 < 2
2
χα/2,n−1
χ1−α/2,n−1
!
= 1 − α.
Jadi jika S 2 = s2 , interval kepercayaan 100(1 − α) persen untuk σ 2 adalah
!
(n − 1)S 2 (n − 1)S 2
,
.
χ2α/2,n−1 χ21−α/2,n−1
Contoh 58. Kapasitas 10 batere diukur dan hasilnya sebagai berikut (dalam
ampere − jam):
140,
136,
150,
144,
148,
152,
138,
141,
143,
151.
(a) Carilah estimasi untuk varian populasi σ 2 , dan (b) hitunglah interval kepercayaan 99 persen untuk σ 2 .
Penyelesaian. (a) Dari data tersebut diperoleh x = 144.3. Estimasi untuk
varian populasi
10
X
(Xi − 144.4)2
S2 =
= 32.23.
10 − 1
i=1
(b) Karena 1 − α = 0.99 maka α/2 = 0.01/2 = 0.005. Berdasarkan tabel
Chi-square diperoleh χ20.005,9 = 23.589 dan χ21−0.005,9 = χ20.995,9 = 1.735.
Jadi interval kepercayaan 99 persen untuk σ 2 adalah
(n − 1)S 2 (n − 1)S 2
,
χ2α/2,n−1 χ21−α/2,n−1
!
=
9 × 32.23 9 × 32.23
,
23.589
1.735
= (12.30, 167.19),
yang berarti bahwa dapat dipercaya 99 persen nilai varian populasi berada
pada interval (12.30, 167.19).
54
BAB 8. ESTIMASI
8.4
Interval Kepercayaan Selisih Dua Mean
Dalam suatu penelitian mungkin kita ingin membentuk interval kepercayaan
selisih dua mean populasi. Misalkan X1 , X2 , · · · , Xn adalah sampel random dari
populasi berdistribusi normal dengan mean µ1 dan varian σ12 , dan Y1 , Y2 , · · · , Ym
adalah sampel random dari populasi berdistribusi normal dengan mean µ2 dan
varian σ22 . Kita akan membentuk interval kepercayaan selisih kedua mean populasi, yaitu µ1 − µ2 .
Dari pembahasan sebelumnya X̄ berdistribusi normal dengan mean µ1 dan
varian σ12 /n; dan Ȳ berdistribusi normal dengan mean µ2 dan varian σ22 /m.
Oleh karena itu X̄ − Ȳ berdistribusi normal dengan mean µ1 − µ2 dan varian
σ12 /n + σ22 /m.
Pembahasan akan dibagi menjadi dua, yaitu jika σ12 dan σ22 diketahui dan
tidak diketahui.
Jika σ12 dan σ22 diketahui, maka
X̄ − Ȳ − (µ1 − µ2 )
q
σ12
σ22
n + m
berdistribusi normal standar.
Dengan demikian interval kepercayaan 100(1-α) persen untuk µ1 − µ2 adalah
!
r
r
σ22
σ22
σ12
σ12
x̄ − ȳ − zα/2
+
, x̄ − ȳ + zα/2
+
n
m
n
m
Contoh 59. Hasil pengamatan IQ yang diambil dari dua populasi anak yang
tinggal di perkotaan (A) dan di pedesaan (B) adalah sebagai berikut Jika dikeSampel A :
Sampel B :
100
121
104
101
108
120
99
98
115
99
120
104
103
104
112
107
124
111
120
123
110
tahui varians IQ anak-anak di perkotaan dan pedesaan berturut-turut adalah
7, 02 dan 6, 8, carilah interval kepercayaan 90 persen selisih rata-rata kedua
kelompok anak.
Penyelesaian. Diketahui n1 = 11, n2 = 10, σ12 = 7.02 dan σ22 = 6.8. Dapat
dihitung bahwa
x̄1 = 110.45 x̄2 = 108.8
Karena zα/2 = z0.05 = 1.645, maka interval kepercayaan 90 persen untuk µ1 −µ2
adalah
q
q
6.8
7.02
6.8
110.45 − 108.8 − (1.645) 7.02
+
,
110.45
−
108.8
+
(1.645)
= (−0.24, 3.54)
11
10
11 + 10
yang berarti bahwa 90 persen dapat dipercaya seleisih IQ anak di perkotaan
dan di pedesaan berada pada interval −0.24 sampai dengan 3.54.
8.4. INTERVAL KEPERCAYAAN SELISIH DUA MEAN
55
Jika varian kedua populasi tidak diketahui, namun nilainya sama, maka kita
dapat menggunakan varian sampel,
P
P
1
1
2
2
s2x = n−1
s2y = m−1
i (xi − x̄)
i (yi − ȳ)
(8.2)
(n−1)s2x +(m−1)s2y
s2p =
n+m−2
dan interval kepercayaan 100(1 − α) persen untuk µ1 − µ2 adalah
p
p
x̄ − ȳ − tα/2, n+m−2 sp 1/n + 1/m, (x̄ − ȳ + tα/2, n+m−2 sp 1/n + 1/m
(8.3)
Contoh 60. Jika varian kedua populasi pada contoh 59 tidak diketahui tetapi
dianggap sama, carilah interval kepercayaan 90 persen untuk beda mean kedua
populasi.
Penyelesaian. Misalkan X dan Y berturut-turut menyatakan variabel random
IQ anak perkotaan dan anak pedesaan. Berdasarkan data diatas, n = 11 dan
m = 10. Selanjutnya dapat dihitung bahwa
x̄ = 110.45
s2x = 73.2727
ȳ = 108.8
s2y = 89.2889
(10)(73.2727 + (9)(89.2889)
= 80.8593,
sp = 8.9923
19
Berdasarkan tabel, nilai tα/2, n+m−2 = t0.05, 19 = 1.729. Oleh karena itu interval
90 persen untuk µ1 − µ2 adalah
p
p
110.45 − 108.8 − (1.729)(8.9923) 1/10 + 1/9, 110.45 + 108.8 − (1.729)(8.9923) 1/10 + 1/9
= (1.65 − 7.1437, 1.65 + 7.1437) = (−5.4937, 8.7937)
s2p =
Ini berarti dapat dipercaya 90 persen bahwa selisih mean IQ antara anak
perkotaan dan anak pedesaan berada di antara -5.4937 dan 8.7937.
56
BAB 8. ESTIMASI
Bab 9
Uji Hipotesis
Dalam penerapan kita sering menyatakan suatu sifat populasi berdasarkan informasi sampel. Suatu pernyataan atau klaim tentang parameter populasi dinamakan hipotesis statistik. Dinamakan hipotesis statistik karena pernyataan
tersebut bisa benar atau bisa tidak benar.
Definisi 20. Uji hipotesis adalah suatu aturan dimana setelah data sampel
diperoleh maka akan menuntun kepada diterima atau ditolaknya suatu hipotesis.
Suatu hipotesis yang akan diuji dinamakan hipotesis nol, ditulis H0 . Hipotesis yang berbeda dengan hipotesis nol dinamakan hipotesis alternatif, ditulis H1 .
Suatu hipotesis yang jika benar maka menggambarkan secara lengkap distribusi populasi, dinamakan hipotesis sederhana. Jika tidak demikian maka
dinamakan hipotesis komposit. Sebagai contoh tinjau dua hipotesis berikut.
(a) Rata-rata berat badan mahasiswa UM Palangkaraya adalah µ = 60
(b) Rata-rata berat badan mahasiswa UM Palangkaraya adalah µ ≤ 60
Hipotesis (a) merupakan hipotesis sederhana, sedangkan hipotesis (b) merupakan hipotesis komposit. Perhatikan bahwa jika hipotesis (a) benar, maka nilai parameter populasi secara tegas dinyatakan dengan µ = 1; sebaliknya pada
hipoteis (b) jika benar maka nilai parameter populasi µ tidak dapat tergambar
secara tegas.
Contoh 61. Kita klaim bahwa rata-rata berat badan mahasiswa UM Palangkaraya
adalah 60 kg. Untuk membuktikan benar atau tidaknya klaim tersebut, maka
perlu diuji. Dalam hal ini hipotesis nolnya adalah ”rata-rata berat badan mahasiswa UM Palangkaraya adalah 60 kg”. Hipotesis alternatifnya misalnya adalah
”rata-rata berat badan mahasiswa UM Palangkaraya tidak sama dengan 60 kg”.
57
58
BAB 9. UJI HIPOTESIS
Hipotesis alternatif lainnya misalnya adalah ”rata-rata berat badan mahasiswa
UM Palangkaraya adalah kurang dari 60 kg”.
Perhatikan kembali contoh 61. Jika hipotesis nolnya adalah ”rata-rata berat
badan mahasiswa UM Palangkaraya adalah 60 kg” dan hipotsis alternatifnya
adalah ”rata-rata berat badan mahasiswa UM Palangkaraya tidak sama dengan
60 kg”, maka kita dituliskan
H0 :
µ = 60
H1 :
µ 6= 60.
melawan hipotesis
Karena H0 dan H1 merupakan pernyataan yang komplementer, maka mudah
dipahami bahwa jika kita menerima H0 tentu kita tidak menerima H1 atau
menolak H1 . Demikian pula jika kita menolak H0 berarti kita menerima H1 .
Karena data yang digunakan untuk menerima atau menolak suatu hipotesis
adalah data sampel, maka kita tidak dapat memastikan apakah hipotesisi tersebut benar atau salah. Dalam pengambilan kesimpulan, kalaupun ada kesalahan tentu kita berharap kesalahan tersebut sekecil mungkin. Menolak suatu
pernyataan yang benar tentu merupakan suatu kesalahan. Demikian pula,
menerima suatu pernyataan yang salah tentu merupakan suatu kesalahan.
Definisi 21. Kesalahan jenis I adalah ditolaknya H0 padahal H0 benar. Kesalahan jenis II adalah diterimanya H0 padahal H0 salah.
Definisi 22. Tingkat signifikansi suatu uji hipotesis, ditulis α, adalah peluang
terjadinya kesalahan jenis I.
9.1
9.1.1
Uji tentang mean populasi normal
Uji hipotesis dengan σ 2 diketahui
Diketahui X1 , X2 , · · · , Xn adalah sampel random dari populasi berdistribusi
normal dengan mean µ dan varian σ 2 yang diketahui. Misalkan kita akan menguji hipotesis
H0 : µ = µ0
melawan hipotesis
H1 :
µ 6= µ0
9.1. UJI TENTANG MEAN POPULASI NORMAL
59
dimana µ0 suatu konstanta.
Pn Xi
Karena X =
i=1 n adalah estimator untuk µ, maka cukup beralasan
bahwa kita menerima H0 jika X tidak berbeda jauh dengan µ0 . Karena X
berdistribusi normal dengan mean µ dan varian σ 2 /n, maka H0 benar asalkan
Z=
X − µ0
√
σ/ n
berdistribusi normal standar.
Aturan 1. Untuk menguji hipotesis
H0 : µ = µ0
melawan hipotesis
H1 : µ 6= µ0
digunakan aturan
√
terima
H0
jika
tolak
H0
jika
n X − µ0 ≤ zα/2
√σ
n z=
X − µ0 > zα/2
σ
z=
Contoh 62. Akan diuji suatu pernyataan bahwa rata-rata jumlah anak per KK
di Palangkaraya adalah 3. Diambil sampel random berukuran 100 dan diperoleh
rata-rata sampel x = 2.84. Jika diketahui σ = 0.8 akan diuji hipotesis tersebut
pada tingkat signifikansi α = 0.05.
Dalam hal ini hipotesis yang akan diuji
H0 : µ = 3
melawan hipotesis
H1 : µ 6= 3
Penyelesaian Berdasarkan tabel normal standar, zα/2 = z0.025 = 1.96. Diperoleh
√
√
n 100
z=
X − µ0 =
|2.84 − 3| = 2.0.
σ
0.8
Karena z > z0.025 ini berarti H0 ditolak dan disimpulkan bahwa rata-rata
banyaknya anak per KK di Palangkaraya tidak sama dengan 3.
Dapat terjadi H0 : µ ≤ µ0 dan hipotesis alternatifnya adalah H1 : µ > µ0 .
Untuk menguji hipotesis demikian kita gunakan aturan berikut.
60
BAB 9. UJI HIPOTESIS
Aturan 2. Untuk menguji hipotesis:
H0 : µ ≤ µ0
melawan hipotesis
H1 : µ > µ 0
digunakan aturan
√
n
X − µ0 ≤ zα
√σ
n
X − µ0 > zα
tolak H0 jika z =
σ
Uji hipotesis demikian dinamakan uji hipotesis satu sisi.
terima
H0
jika
z=
Demikian pula dapat terjadi H0 : µ ≥ µ0 dan hipotesis alternatifnya adalah
H1 : µ < µ0 .
Aturan 3. Untuk menguji hipotesis:
H0 : µ ≥ µ0
melawan hipotesis
H1 : µ < µ 0
digunakan aturan
√
n
X − µ0 ≥ −zα
√σ
n
X − µ0 < −zα
tolak H0 jika z =
σ
Contoh 63. Semua rokok yang beredar di pasaran mengandung nikotin paling
sedikit 1.6 mg per batang rokok. Suatu perusahaan rokok mengklaim dengan
suatu metode tertentu dapat menurunkan kadar nikotin kurang dari 1.6 mg per
batang rokok. Untuk menguji klaim tersebut, sampel berukuran 20 dari perusahaan tersebut dianalisis. Diketahui devisi standar nikotin pada rokok adalah 0.8
mg. Jika rata-rata nikotin ke 20 rokok pada sampel tersebut adalah 1.54, apakah
klaim perusahaan tersebut dapat diterima pada tingkat signifikansi 5 persen?
terima
H0
jika
z=
Penyelesaian Akan diuji hipotesis
H0 : µ ≥ 1.6
melawan H1 : µ < 1.6.
Berdasarkan tabel normal diperoleh z−α = z−0.05 = −1.65. Berdasarkan data
di atas diperoleh
√
√
n
20
z=
X − µ0 =
(1.54 − 1.6) = −0.336.
σ
0.8
Karena z ≥ z−0.05 maka H0 diterima, yang berarti klaim perusahaan tersebut
tidak benar pada tingkat signifikansi 5 persen.
9.1. UJI TENTANG MEAN POPULASI NORMAL
9.1.2
61
Uji hipotesis dengan σ 2 tidak diketahui
Dalam situasi yang lebih umum, mean populasi µ dan varian populasi σ 2 biasanya tidak diketahui.
Aturan 4. Untuk menguji hipotesis
H0 : µ = µ0
melawan hipotesis
H1 : µ 6= µ0
digunakan aturan
√
terima
H0
jika
tolak
H0
jika
n X − µ0 ≤ tα/2,n−1
√S
n t=
X − µ0 > tα/2,n−1
S
t=
dimana S 2 adalah varian sampel dan n ukuran sampel.
Contoh 64. Pemerintah mengklaim bahwa kebutuhan air bersih rata-rata
rumah tangga adalah 350 galon per hari. Untuk membuktikan klaim tersebut, suatu studi terhadap 20 rumah tangga dilaksanakan dan diperoleh data
340
356
332
362
318
344
386
402
322
360
362
354
340
372
338
375
364
355
324
370
Berdasarkan data sampel tersebut, apakah klaim pemerintah dapat diterima
pada tingkat signifikansi 10 persen?
Penyelesaian Akan diuji hipotesis
H0 : µ = 350
melawan
H1 : µ 6= 350.
Berdasarkan data tersebut diperoleh
X = 353.8
dan S = 21.8478.
Dengan demikian
√
n 20
t=
X − µ0 =
|353.8 − 350| = 0.7778
S
21.8478
√
Berdasarkan tabel t diperoleh tα/2,n−1 = t0.05,19 = 1.729. Karena t < t0.05,19
berarti H0 diterima, yang berarti bahwa klaim pemerintah dapat diterima dengan tingkat signifikansi 10 persen.
62
BAB 9. UJI HIPOTESIS
Aturan 5. Uji hipotesis satu sisi:
H0 : µ ≤ µ0
melawan hipotesis
H1 : µ > µ 0
digunakan aturan
√
terima
H0
jika
tolak
H0
jika
n
X − µ0 ≤ tα,n−1
S
√
n
t=
X − µ0 > tα,n−1
S
t=
dimana S 2 adalah varian sampel dan n ukuran sampel.
Demikian pula uji hipotesis satu sisi:
Aturan 6.
H0 : µ ≥ µ0
melawan hipotesis
H1 : µ < µ 0
digunakan aturan
√
terima
H0
jika
tolak
H0
jika
n
X − µ0 ≥ −tα,n−1
√S
n
t=
X − µ0 < −tα,n−1
S
t=
dimana S 2 adalah varian sampel dan n ukuran sampel.
9.2
Uji kesamaan mean dua populasi
Jika kita ingin mengetahui efek suatu jenis obat dalam menyembuhkan suatu
penyakit, maka setidaknya kita mencoba obat tersebut ke suatu sampel dan
membandingkan hasilnya dengan sampel lain yang tidak diberi obat, yakni kita
memiliki dua sampel yang mendapat perlakuan berbeda.
Untuk mengetahui apakah suatu metode belajar tertentu memberikan hasil yang
berbeda dengan metode belajar yang ada, tentu kita harus mencobakan metode
tertentu tersebut dan membandingkan hasilnya dengan metode yang ada.
Pada kedua contoh, yang akan kita selidiki dapat berupa kesamaan/perbedaan
mean kedua populasi.
9.2. UJI KESAMAAN MEAN DUA POPULASI
9.2.1
63
Varian populasi diketahui
Misalkan X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym adalah dua sampel independen
dari dua populasi yang berdistribusi normal, yang masing-masing memiliki mean
µx dan µy yang tidak diketahui, dan varian σx2 dan σy2 yang diketahui. Andaikan
akan diuji hipotesis
H0 : µx = µy
melawan hipotesis
H1 : µx 6= µy
Karena X adalah estimator µx dan Y adalah estimator µy , maka X − Y dapat
digunakan untuk mengestimasi µx − µy .
Karena H0 dapat ditulis H0 : µx − µy = 0, maka cukup beralasan untuk menerima H0 bilamana X − Y tidak berbeda jauh dengan 0.
Karena X − Y berdistribusi normal dengan mean µx − µy dan varian σx2 /n +
σy2 /m, maka
(X − Y ) − (µx − µy )
q
2
σy2
σx
n + m
berdistribusi normal standar.Ini berakibat jika H0 benar, yakni µx − µy = 0,
maka
X −Y
q
2
σy2
σx
n + m
berdistribusi normal standar. Dengan demikian belaku

P −zα/2

X −Y
≤q
≤ zα/s  = 1 − α.
2
σy2
σx
n + m
Aturan 7. Untuk menguji
H0 : µx = µy
melawan hipotesis
H1 : µx 6= µy
dengan tingkat signifikansi α digunakan aturan
terima
H0
jika
tolak
H0
jika
X − Y z=q
≤ zα/2
2
σy2
σx
+
n
m
X − Y > zα/2 .
z=q
2
σy2
σx
+
n
m
64
9.2.2
BAB 9. UJI HIPOTESIS
Varian populasi tidak diketahui
Misalkan X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym adalah dua sampel independen
dari dua populasi yang berdistribusi normal, yang masing-masing memiliki mean
µx dan µy yang tidak diketahui, dan varian σx2 dan σy2 juga tidak diketahui.
Lebih lanjut dimisalkan σx2 = σy2 = σ 2 . Andaikan akan diuji hipotesis
H0 : µx = µy
melawan hipotesis
H1 : µx 6= µy
Kita akan menerima H0 jika X − Y tidak berbeda jauh dengan 0. Varian
masing-masing sampel adalah
Pn
(Xi − X)2
Sx2 = i=1
n−1
Pm
(Yi − Y )2
Sy2 = i=1
.
m−1
Dapat ditunjukan bahwa
X − Y − (µx − µy )
q
1
Sp2 n1 + m
berdistibusi t dengan dejarat bebas n + m − 2, dimana
Sp2 =
(n − 1)Sx2 + (m − 1)Sy2
.
n+m−2
Oleh karen itu jika H0 benar, yakni jika µx − µy = 0, maka statistik
t= q
X −Y
Sp2
1
n
+
1
m
berdistribusi t dengan dejarat bebas n + m − 2.
Aturan 8. (σx2 dan σy2 sama dan tidak diketahui) Untuk menguji
H0 : µx = µy
melawan hipotesis
H1 : µx 6= µy
dengan tingkat signifikansi α digunakan aturan
terima
tolak
H0
H0
jika
jika
|t| = q
|t| = q
|X − Y |
Sp2
1
n
+
1
m
|X − Y |
Sp2
1
n
+
1
m
≥ tα/2,n+m−2
> tα/2,n+m−2
9.2. UJI KESAMAAN MEAN DUA POPULASI
65
Contoh 65. Dua puluh lima pria sebuah institusi dipilih secara random dan
diamati tekanan darah sistoliknya. Dari 25 pria tersebut tercatat 11 perokok
dan 14 bukan perokok, dan hasil pengamatan tekanan tersebut adalah sebagai
berikut:
Perokok
124
134
136
125
133
127
135
131
133
125
118
Bukan perokok
120
130
122
128
129
118
122
116
127
135
120
122
120
115
123
Apakah ada perbedaan rata-rata tekanan darah sistolik antara perokok dan
bukan perokok pada tingkat signifinasi 5 persen? Bagaimana jika digunakan
tingkat signifikansi 1 persen?
Dalam soal ini hipotesis yang akan diuji adalah
H0 : µx = µy
melawan hipotesis
H1 : µx 6= µy .
Karena kedua sampel diambil dari sebuah institusi, maka varian populasi dianggap sama. Kita gunakan indeks x menyatakan prokok dan indeks y bukan
perokok. Berdasarkan data tersebut diperoleh
nx = 11 X x = 129.18 Sx2 = 32.76,
Sp2 =
ny = 14 X y = 123.36 Sy2 = 32.86,
(nx − 1)Sx2 + (my − 1)Sy2
10 · 32.76 + 13 · 32.86
=
= 32.82
nx + my − 2
23
|X − Y |
|129 − 123|
|t| r =q
= 2.52
1
1
1
1
32.82
+
2
Sp nx + ny
11
14
Karena t0.025,23 = 2.069 (berarti t0.025,23 < |t|), maka H0 ditolak, yang berarti
bahwa rata-rata tekanan sistolik antara perokok dan bukan perokok berbeda
66
BAB 9. UJI HIPOTESIS
pada tingkat signifikansi 5 persen.
Karena t0.005,23 = 2.807, maka H0 diterima, dengan kata lain rata-rata tekanan
sistolik antara perokok dengan bukan perokok tidak berbeda pada tingkat signifikansi 1 persen.
9.2.3
Varian tidak diketahui dan tidak sama
Dimisalkan varian populasi σx2 dan σy2 tidak diketahui dan tidak sama. Karena
Sx2 adalah estimator untuk σx2 dan Sy2 estimator untuk σy2 maka uji hipotesis
H0 : µx = µy
melawan
H1 : µx 6= µy
bisa berdasarkan pada statistik
X −Y
t= q
2
Sy2
Sx
n + m
Jika n dan m cukup besar, maka t akan mendekati distribusi normal standar.
Aturan 9. (σx2 dan σy2 tidak sama dan tidak diketahui) Untuk n dan m besar
9.3
terima
H0
jika
tolak
H0
jika
X −Y ≤ zα/2
q
|t| = Sx2 + Sy2 n
m
X −Y > zα/2
|t| = q
Sx2 + Sy2 n
m
Uji t berpasangan
Misalkan kita ingin mengetahui apakah ada perbedaan hasil pengukuran berat
antara neraca O-haus dengan neraca pegas. Untuk tujuan tersebut kita ambil
sampel n objek kemudian ditimbang beratnya dengan kedua alat. Oleh karena
itu kita mendapatkan n pasang pengamatan yang kita tuliskan sebagai
(Xi , Yi ),
i = 1, 2, · · · , n
dengan Xi dan Yi berturut-turut menyatakan hasil pengukuran dengan neraca
O-haus dan neraca pegas objek ke i.
Suatu cara untuk menguji hipotesis adanya perbedaan hasil pengukuran berat
tersebut adalah dengan menghitung selisih kedua hasil pengukuran. Misalkan
Wi menyatakan selisih antara pengukuran dengan neraca o-haus dan pengukuran dengan neraca pegas. Jika tidak ada perbedaan hasil pengukuran, maka Wi
akan memiliki mean 0. Oleh karena itu kita dapat menuliskan uji hipotesisnya
sebagai berikut.
9.4. UJI HIPOTESI TENTANG VARIAN POPULASI NORMAL
67
Aturan 10. Uji t berpasangan (t paired test). Untuk menguji hipotesis
H0 : µw = 0 melawan H1 : µw 6= 0
√
terima H0 jika − tα/2, n−1 < n SWw < tα/2, n−1
tolah H0 untuk yang lainnya
Contoh 66. Ingin diketahui apakah ada perbedaan hasil pengukuran berat
benda antara necara o-haus dan neraca pegas. Untuk itu diambil 8 sampel
benda dan timbang dengan kedua neraca. Misalkan hasil pengukurannya (dalam
newton) adalah sebagai berikut.
No. Objek
Neraca Ohaus
Necara pegas
1
3.2
3.1
2
4.5
4.6
3
5.3
5.1
4
9.6
9.5
5
4.6
4.7
6
8.0
8.1
7
7.3
7.1
8
2.2
2.0
Penyelesaian Misalkan wi menyatakan selisih hasil pengukuran neraca ohaus
dan neraca pegas. Beradasarkan data di atas diperoleh
No. Objek
wi
1
0.1
2
-0.1
3
0.2
4
0.1
5
-0.1
6
-0.1
7
0.2
8
0.2
Dapat dihitung bahwa mean selisih kedua hasil pengukuran adalah w̄ =
0.0625 dan deviasi standarnya adalah sw = 0.1408. Selanjutnya, karena n = 8,
maka
√ 0.0625
√ w
n
= 1.2555
= 8
sw
0.1408
dan tα/2, n−1 = t0.025, 7 = 2.3646. Karena
−tα/2, n−1 <
√ W
n
< tα/2, n−1
Sw
maka H0 diterima, yang berarti bahwa tidak ada perbedaan hasil pengukuran
kedua jenis alat pada tingkat signifikansi 5 persen.
9.4
Uji hipotesi tentang varian populasi normal
Dalam aplikasi kita sering ingin mengetahui apakah informasi yang tertera pada
kemasan suatu produk cukup dapat dipercaya. Sebagai contoh, apakah sutau jenis obat memiliki kadar paracetamol dengan variasi tertentu. Dalam hal
demikian, kita dapat menguji apakah varian kadar paracetamol tidak berbeda
dengan standar varian yang diijinkan.
Misalkan X1 , X2 , · · · , Xn adalah sampel random dari populasi normal dengan
mean µ dan varian σ 2 yang keduanya tidak diketahui. Akan diuji hipotesis
H0 : σ 2 = σ02
68
BAB 9. UJI HIPOTESIS
melawan hipotesis alternatif
H1 : σ 2 6= σ02
dengan σ02 suatu nilai tertentu.
Ingat kembali bahwa (n−1)S 2 /σ 2 berdistribusi chi-square dengan derajat bebas
n − 1.
Aturan 11. Untuk menguji hipotesis
H0 : σ 2 = σ02
melawan hipotesis alternatif
H0 : σ 2 6= σ02
digunakan aturan
terima H0 jika χ21−α/2,n−1 ≤
tolak H0 untuk lainnya
(n−1)S 2
σ02
≤ χ2α/2,n−1
Contoh 67. Ingin diketahui apakah varian kadar paracetamol suatu jenis obat
tidak melebihi batas yang diijinkan pihak berwenang. Misalkan kadar yang
ijinkan adalah memiliki varian 40 mg. Suatu sampel 12 obat diukur kadar
paracetamolnya dan hasilnya adalah sebagai berikut (dalam mg). Apakah varian paracematmol dapat diterima pada tingkat signifikansi 1 persen?
512
532
502
510
508
502
505
511
510
507
509
512
Penyelesaian Diketahui σ02 = 40, n = 12 dan α = 0.01. Berdasarkan data
dapat dihitung s2 = 60, α/2 = 0.005 sehingga 1 − α/2 = 0.995. Berdasarkan
tabel chi-square diperoleh χ20.995,11 = 2.603 dan χ20.005,11 = 26.757.
(n − 1)S 2
(12 − 1)(60)
=
= 16.5
σ02
40
2
Karena χ20.95,11 ≤ (n−1)S
≤ χ20.05,11 , maka H0 diterima. Ini berarti pada
σ02
tingkat signifikansi 1 persen, varian paracematol jenis obat tersebut tidak melebihi
batas yang diijinkan pihak berwenang.
9.5
Uji hipotesis kesamaan varian dua populasi
normal
Jika kita memiliki dua populasi, maka mungkin kita tertarik untuk mengetahui
apakah variabilitas kedua populasi sama atau berbeda. Sebagai contoh, apakah
variabilitas hasil panen padi lokal sama dengan variabilitas hasil panen padi
unggul nasional.
9.5. UJI HIPOTESIS KESAMAAN VARIAN DUA POPULASI NORMAL 69
Diketahui X1 , X2 , · · · , Xn dan Y1 , Y2 , · · · , Ym dua sampel independen dari
dua populasi normal yang masing-masing memiliki parameter µx , σx2 dan µy , σy2 .
Akan diuji
H0 : σx2 = σy2 melawan H1 : σx2 6= σy2
Varian masing-masing sampel adalah
n
Sx2 =
1 X
(Xi − X̄)2
n−1 i
Sy2 =
1 X
(Yi − Ȳ )2
m−1 i
m
Ingat kembali bahwa (n − 1)Sx2 /σx2 dan (m − 1)Sy2 /σy2 adalah variabel random
indepnden dengan derajab bebas masing-masing n − 1 dan m − 1. Oleh karena
itu
Sx2 /σx2
Sy2 /σy2
berdistribsi F dengan derajat bebas pembilang n−1 dan derajat bebas penyebut
m − 1.
Aturan 12. Untuk menguji hipotesis
H0 : σx2 = σy2
melawan H1 : σx2 6= σy2
pada tingkat signifikansi α digunakan aturan
terima H0 jika F1−α/2, n−1,m−1 < Sx2 /Sy2 < Fα/2,n−1,m−1
tolak H0 untuk yang lain
Contoh 68. Ingin diketahui apakah ada perbedaan variabilitas hasil panen
padi lokal dengan padi unggul nasional pada tingkat signifikansi 5 persen. Suatu
sampel padi lokal berukuran 10 dan sampel padi unggul nasional berukuan 13
diambil. Hasil pengamatan (dalam ton per hektar) adalah sebagai berikut.
Padi lokal
Padi unggul nasional
1.5
3.9
2.3
4.0
2.5
4.2
1.9
4.1
3.0
4.0
2.5
3.8
Penyelesaian Berdasarkan data di atas diperoleh
Sx2 = 0.205 Sy2 = 0.0509
Sx2 /Sy2 = 0.205/0.0509 = 4.0277
Berdasarkan tabel, F0.95,9,12 = 2.80
1.7
3.9
1.8
4.3
2.0
4.5
2.3
4.4
3.8
3.9
4.0
70
9.6
BAB 9. UJI HIPOTESIS
Uji Goodness of Fit
Misalkan satu mata uang logam seimbang dilontarkan 1000 kali. Frekuensi
harapan terjadinya sisi angka tentu 1000 · 21 = 500 kali. Namun demikian
frekuensi terjadinya sisi angka hasil observasi bisa berbeda dengan frekuensi
harapan tersebut. Untuk menguji apakah hasil percobaan ini sesuai dengan
hasil teoritis digunakan satu uji statistik.
Goodness of fit adalah suatu uji statistik untuk menentukan apakah suatu
populasi memiliki distribusi tertentu.
Misalkan kita memiliki k persitiwa E1 , E2 , · · · , Ek yang masing-masing dapat terjadi dengan peluang p1 , p2 , · · · , pk . Jika diambil sampel random berukuran n dari populasi ini, nilai observasi untuk peristiwa E1 , E2 , · · · , Ek dapat
dinyatakan sebagai variabel random X1 , X2 , · · · , Xk . Frekuensi harapan peristiwaperistiwa tersebut masing-masing adalah np1 , np2 , · · · , npk . Dalam bentuk tabel
dapat dinyatakan sebagai berikut.
Peristiwa
Frekuensi observasi
Frekuensi harapan
E1
x1
np1
···
···
···
E2
x2
np2
Ek
xk
npk
Aturan 13. Untuk menguji apakah nilai observasi menyimpang terhadap nilai
harapan digunakan aturan sebagai berikut.
χ2 =
(X1 − np1 )2
(X2 − np2 )2
(Xk − npk )2
+
+ ··· +
np1
np2
npk
(9.1)
terima H0 jika χ2 < χ2α,k−1
tolak H0 jika χ2 ≥ χ2α,k−1
Contoh 69. Satu dadu dilontarkan 120 kali. Hasil observasi dan nilai harapan
setiap sisi dinyatakan dalam tabl berikut.
Sisi
Nilai observasi
Nilai harapan
1
22
20
2
23
20
3
18
20
4
19
20
5
21
20
6
17
20
Jika dadu tersebut seimbang, tentu kita berharap setiap sisi memiliki peluang 1/6. Dengan demikian dalam 120 lontaran, setiap sisi diharapkan terjadi
1
6 120 = 20 kali. Namun berdasarkan hasil observasi, ternyata tidak semua
sisi terjadi 20 kali. Apakah ini berarti dadu tersebut tidak seimbang? Untuk
mengetahuinya kita gunakan uji chi-square.
χ2 =
(22 − 20)2 (23 − 20)2 (18 − 20)2 (19 − 20)2 (21 − 20)2 (17 − 20)2
+
+
+
+
+
= 1.4
20
20
20
20
20
20
Berdasarkan tabel, χ20.05,5 = 11.070. Karena nilai yang dihitung χ2 < χ20.05,5
maka hipotesis nol diterima, dengan kata lain tidak cukup bukti untuk mengatakan bahwa dadu tidak seimbang.
9.7. UJI INDEPENDEN
9.7
71
Uji Independen
Misalkan kita ingin mengetahui apakah tingkat pendapatan masyarakat independen terhadap keputusan untuk menolak atau menerima kenaikan BBM. Misalkan ada 3 tingkat pendapatan: miskin, sedang dan kaya. Dalam hal ini populasi memiliki dua karakteristik, yaitu yang setuju dan yang tidak setuju dengan
kenaikan BBM. Kedua karakteristik masyarakat terbagi dalam 3 golongan, yaitu
miskin, sedang dan kaya.
Misalkan kita memiliki suatu populasi yang dapat diklasifikasikan menjadi dua
karakteristik, namakan X dan Y . Misalkan ada r nilai yang mungkin untuk
kelas X dan ada s nilai yang mungkin untuk klas Y . Peluang kelas X terjadi
nilai i dan kelas Y terjadi nilai j ditulis Pij . Jadi
Pij = P (X = i, Y = j)
Setiap anggota populasi diasumsikan independen. Peluang sebarang anggota
populasi memiliki sifat X dengan nilai iadalah
X
pi =
j = 1s Pij
Peluang sebarang anggota populasi memiliki sifat Y dengan nilai j adalah
X
qj =
i = 1r Pij
Misalkan kita ingin menguji hipotsis bahwa anggota populasi dengan sifat X
dan Y independen, yaitu
H0 : pij = pi qj
melawan hipotesis
H1 : pij 6= pi qj
Karena nilai pi dan qi tidak dinyatakan secara spesifik di dalam hipotesis,
maka kita harus menduga nilai tersebut. Banyaknya anggota populasi dengan
karakteristik X dan berpendapat i adalah
r
X
Ni =
Nij
j=1
Estimator untuk pi adalah
p̂i =
Ni
,
n
i = 1, 2, · · · , r
Banyaknya anggota populasi dengan karakeristik Y dan memilih j adalah
Mj =
r
X
i=1
Nij
72
BAB 9. UJI HIPOTESIS
Estimator untuk qi adalah
q̂i =
Mj
,
n
j = 1, 2, · · · , s
Jika H0 benar, maka
E(Nij ) = npi qj
dan
T =
s X
r
X
(Nij − np̂i q̂j )2
np̂i q̂j
j=1 i=1
berdistribusi chi-square dengan derajat bebas (r − 1)(s − 1). Oleh karena itu
Aturan 14. Untuk menguji hipotesis
H0 : pij = pi qj
melawan hipotesis
H1 : pij 6= pi qj
digunakan aturan
T =
r
s X
X
(Nij − np̂i q̂j )2
np̂i q̂j
j=1 i=1
terima H0 jika T ≥ χ2α,(r−1)(s−1)
tolak H0 untuk lainnya
Contoh 70. Untuk mengetahui apakah keputusan menolak atau menerima kenaikan BBM independen terhadap tingkat pendapatan masyarakat diambil sampel random berukuran 200 orang. Hasil observasi diberikan dalam tabel berikut
(dinamakan tabel contingency).
Tingkat pendapatan
Setuju
Tidak Setuju
Jumlah
Miskin
30
44
74
Sedang
32
35
67
Kaya
32
27
59
Jumlah
94
106
200
Dari tabel tersebut diperoleh
94
= 0.47
p̂1 = 200
106
p̂2 = 200 = 0.53
74
q̂1 = 200
= 0.37
67
= 0.335
q̂2 = 200
59
q̂3 = 200
= 0.295
np̂1 q̂1 = (200)(0.47)(0.37) = 34.78
np̂1 q̂2 = (200)(0.47)(0.335) = 31.49
np̂1 q̂3 = (200)(0.47)(0.295) = 27.73
np̂2 q̂1 = (200)(0.53)(0.37) = 39.22
np̂2 q̂2 = (200)(0.53)(0.335) = 35.51
np̂2 q̂3 = (200)(0.53)(0.295) = 31.27
2
2
2
+ (32−31.49)
+ (32−27.73)
+
T = (30−34.78)
34.78
31.49
27.73
(44−39.22)2
39.22
+
(35−35.51)2
35.51
+
(27−31.27)2
31.27
= 2.5415.
9.7. UJI INDEPENDEN
73
Karena (r − 1)(s − 1) = 2 dan χ20.05,2 = 5.911, maka kita terima H0 , yakni
keputusan untuk menerima atau menolak kenaikan BBM adalah independen.
74
BAB 9. UJI HIPOTESIS
Bab 10
Regresi Linear Sederhana
Di dalam bidang ilmu pengetahuan dan teknologi, kita sering mencari hubungan
antara dua variabel, misalnya hubungan antara tekanan gas dengan temperatur,
hubungan antara pendapatan dan konsumsi, hubungan antara lama belajar dan
prestasi belajar, dan sebagainya.
Hubungan di atas dapat dinyatakan sebagai hubungan dua variabel, yaitu variabel repon atau variabel tak bebas, dan variabel penjelas (explanatory) atau
variabel bebas. Jika X menyatakan variabel bebas dan Y menyatakan variabel
respon, maka hubungan kedua variabel dapat dinyatakan sebagai fungsi.
Di dalam bagian ini kita akan mencari hubungan linear antara dua variabel.
Hubungan demikian merupakan hubungan yang mudah ditangani dan banyak
persoalan di dalam penerapan dapat dinyatakan dalam bentuk hubungan linear.
Di dalam mencari hubungan antara variabel Y dan X biasanya kita mulai
dengan melakukan observasi dan mencatat hasilnya dalam bentuk pasangan
(Xi , Yi ).
Contoh 71. Hasil 10 observasi temperatur gas (X) dan tekanan gas (Y ) diperoleh data berikut
Observasi ke
1
2
3
4
5
6
7
8
9
10
Temperatur (◦ C)
60
70
80
90
100
110
120
130
140
150
75
Tekanan (atm)
2.3
2.5
2.6
3.3
3.8
3.9
4.2
4.4
4.5
4.7
76
BAB 10. REGRESI LINEAR SEDERHANA
Untuk mencari hubungan antara tekanan dan temperatur, akan sangat membantu jika dibuat terlebih dahulu diagram yang menggambarkan titik-titik hasil
observasi. Diagram demikian dinamakan diagram pencar (scater diagram).
Gambar 10.1: Diagram pencar
Hubungan linear antara variabl X dan Y dapat dituliskan sebagai persamaan
garis lurus
Ŷ = α + βX
Tentu kita menginginkan agar garis lurus tersebut dapat mewakili titik-titik
pada diagram pencar tersebut. Garis ini tentu tidak bisa melewati semua titiktitik pada diagam pencar tersebut. Oleh kerana itu ada deviasi antara titik-titik
pada diagram dengan titik-titik pada garis tersebut.
Dalam hal yang lebih umum, misalkan kita telah melakukan n percobaan
yang datanya adalah
Observasi ke
1
2
..
.
X
X1
X2
..
.
Y
Y1
Y2
..
.
n
Xn
Yn .
Model regresi linear sederhana dapat dituliskan sebagai
Yi = α + βXi + i
dimana:
10.1. SIFAT ESTIMATOR β̂ DAN α̂
77
• Yi nilai variabel respon observasi ke i
• α dan β adalah parameter
• Xi nilai variabel bebas observasi ke i
• i adalah kesalahan random yang diasumsikan berdistribusi normal dengan nilai harapan 0 dan varian σ 2
• i = 1, 2, · · · , n.
Agar model tersebut dapat digunakan, parameter α dan β harus diestimasi.
Kita tentu menghendaki agar suku kesalahan i dibuat sekecil mungkin. Ada suatu metoda di dalam matematika untuk mencari parameter ini sehingga jumlah
kuadrat kesalannya adalah minimal, yaitu yang dinamakan least square method.
Dengan menggunakan metoda ini, kedua parameter dapat diestimasi sebagai
berikut:
β̂ =
Pn
P
Xi Yi −X n
i=1 Yi
Pn
2
2
X
−nX
i=1
i
i=1
(10.1)
α̂ = Y − β̂X
Contoh 72. Berdasarkan data pengamatan, pada contoh 71 diperoleh
n = 10,
X = 105,
n
X
Yi = 36.2,
n
X
Xi2
= 118500,
i=1
i=1
n
X
Xi Yi = 4038,
i=1
Oleh karena itu α̂ dan β̂ dapat dicari sebagai berikut
β̂ =
4038−105×36.2
118500−10×1052
= 0.0287
α̂ = 3.62 − (0.0287)(105) = 0.6036,
yang berarti bahwa hubungan antara temperatur X dan tekanan Y dapat dinyatakan sebagai
Ŷ = 0.6036 + 0.0287X.
10.1
Sifat Estimator β̂ dan α̂
Di dalam persamaan 10.1, nilai harapan dari β̂ dan α̂ berturut-turut adalah
E(β̂) = β
E(α̂) = α
(10.2)
Dengan demikian β̂ dan α̂ masing-masing merupakan estimator tak bias
untuk parameter β dan α.
78
BAB 10. REGRESI LINEAR SEDERHANA
Untuk mengetahui variabilitas kedua estimator, dapat dipelajari melalui varian
kedua estimator. Varian β̂ dan α̂ adalah
V ar(β̂) =
V ar(α̂) =
2
P 2σ
2
xi −nx̄
P 2
σ2
xi
P
n( x2i −nx̄2 )
(10.3)
Selisih antara nilai respon Yi dengan nilai prediksi Ŷi dinamakan residual,
residual = Yi − α̂ − β̂xi
Untuk mengukur seberapa besar ppenyimpnagan nilai respon terhadap prediksi
diambil jumlah kuadrat residual. Jumlah kuadrat residual, ditulis SSR adalah
SSR =
X
Yi − α̂ − β̂xi
2
Dapat dibuktikan bahwa
SSR
σ2
berdistribusi chi-square dengan derajat bebas n − 2. Oleh karena itu nilai harapan SSR/(n − 2) adalah
SSR
E
= σ2
(n − 2)
yang berarti
SSR
(n−2)
merupakan estimator tak bias untuk parameter σ 2 .
Untuk pembahasan selanjutnya, kita akan menggunakan notasi berikut:
Pn
Pn
Sxx = Pi=1 (xi − x̄)2 = P i=1 x2i − nx̄2
n
n
2
2
Syy = Pi=1 (yi − ȳ)2 = i=1 yP
(10.4)
i − nȳ
n
n
Sxy = i=1 (xi − x̄)(yi − ȳ) = i=1 xi yi − nx̄ȳ
10.2
Inferensi tentang parameter β dan α
Karena β̂ merupakan estimator, maka kita bisa membentuk interval kepercayaan
parameter β. Interval kepercayaan 100(1 − α) persen untuk β diberikan oleh
s
s
!
SSR
SSR
, β̂ + tα/2,n−2
β̂ − tα/2,n−2
(n − 2)Sxx
(n − 2)Sxx
Di dalam persamaan regresi
y = α + βx + e
penting untuk menguji hipotesis apakah β sama dengan 0, yaitu
H0 : β = 0
melawan
H1 : β 6= 0
10.3. KOEFISIEN DETERMINASI
79
pada tingkat signifikansi α. Untuk menguji H0 pada tingkat signifikansi α digunakan statistik penguji
r
(n − 2)Sxx
t=
β
SSR
dimana H0 diterima jika |t| ≤ tα/2,n−2 dam ditolak jika |t| > tα/2,n−2 .
Interval kepercayaan untuk parameter intersep α adalah
s P
α̂ −
10.3
x2i SSR
tα/2,n−2 , α̂ +
n(n − 2)Sxx
s P
x2i SSR
tα/2,n−2
n(n − 2)Sxx
!
(10.5)
Koefisien Determinasi
Berdasarkan data (X1 , Y1 ), (X2 , Y2 ), · · · , (Xn , Yn ), kita bisa mencari variasi variabel respon Y yang disebabkan pengaruh variabel penjelas X. Variasi variabel
Y didefinisikan oleh
Syy =
n
X
(Yi − Ȳ )2
(10.6)
i=1
Karena Y = α + βX + , maka variasi Y disebabkan oleh dua komponen,
yaitu
• komponen variasi yang disebabkan oleh variabel bebas X
• komponen variasi yang disebabkan oleh faktor kesalahan random .
Karena variasi yang sebabkan oleh faktor kesalahan random adalah SSR,
maka variasi yang disebabkan oleh variabel penjelas X = variasi Y - variasi
oleh kesalahan random.
Proporsi variasi yang disebabkan oleh variabel penjelas dinamakan koefisien
determinasi, ditulis R2 . Dengan demikian
R2 =
variasi X
Syy − SSR
SSR
=
=1−
variasi Y
Syy
Syy
(10.7)
Perhatikan bahwa 0 ≤ Syy − SSR ≤ Syy . Oleh karena itu nilai koefisien determinasi memenuhi 0 ≤ R2 ≤ 1.
Nilai koefisien determinasi R2 dapat digunakan untuk menilai seberapa tepat
model regresi yang telah diperoleh. Nilai R2 = 1 menunjukan model regresi
yang diperoleh sangat baik, sedangkan nilai R2 = 0 menunjukan model regresi
yang diperoleh sangat jelek untuk menggambarkan hubungan kedua variabel.
80
BAB 10. REGRESI LINEAR SEDERHANA
10.4
Korelasi
Korelasi merupakan ukuran keeratan hubungan antara dua variabel. Di dalam
korelasi tidak dipersoalkan hubungan sebab akibat. Dengan demikian pernyataan ”korelasi antara variabel X dan Y ” sama saja dengan pernyataan ”korelasi antara variabel Y dan X”.
Keeratan hubungan antara dua variabel dinyatakan dengan koefisien korelasi. Jika (x1 , y1 ), (x2 , y2 ), · · · , (xn , yn ) adalah data sampel, maka koefisien
korelasi antara variabel X dan Y , ditulis r, didefinisikan
Pn
(xi − x̄)(yi − ȳ)
(10.8)
r = pPn i=1
Pn
2
2
(x
i=1 (yi − ȳ)
i=1 i − x̄)
Nilai koefisien korelasi adalah antara −1 sampai dengan 1, yakni
−1 ≤ r ≤ 1
Variabel X dan Y dikatakan berkorelasi positif jika r > 0, dikatakan berkorelasi
negatif jika r < 0 dan dikatakan tidak berkorelasi jika r−0. Jika X dan Y berkorelasi positif, maka dengan meningkatnya nilai X, nilai Y juga meningkat. Jika
korelasi antara X dan Y negatif, maka semakin besar nilai X semakin menurun
nilai Y . Jika X tidak berkorelasi dengan Y maka perubahan X tidak mempengaruhi perubahan Y . Nilai koefisien korelasi yang mendekati 1 mengindikasikan
hubungan kuat positif antara variabel X dan Y , nilai koefisien korelasi yang
mendekadi −1 menunjukan hubungan kuat negatif antara X dan Y .
Dengan menggunakan notasi 10.4 di atas, persamaan 10.8 dapat dituliskan
sebagai
Pn
(xi − x̄)(yi − ȳ)
Sxy
(10.9)
=p
r = pPn i=1
Pn
2
2
Sxx Syy
i=1 (xi − x̄)
i=1 (yi − ȳ)
Karena SSR =
2
Sxx Syy −Sxy
,
Sxx
r2
maka
=
2
Sxy
Sxx Syy
Sxx Syy −SSRSxx
Sxx Syy
1 − SSR
Syy
2
=
=
= R ,
yakni
|r| =
√
R2
Ini berarti nilai absolut koefisien korelasi sama dengan akar dua koefisien determinasi. Tanda r sama dengan tanda koefisien β̂ didalam persamaan regresi.
Daftar Pustaka
[1] Brase, C.H., and Brase, C.P., Understanding Basic Statistics., 4th ed.,
Houghton Mifflin Company, New York, 2007.
[2] Hogg, R.V., and Craig, A.T., Introduction to Mathematical Statistics., 3rd
ed., Macmillan Publishing Co Inc.,New York, 1970.
[3] Ross, S.M., Probability and Statistics for Engineer and Scientits., 3rd ed.,
Elsevier Academic Press, USA, 2004.
81
82
DAFTAR PUSTAKA
Appendix
Tabel-tabel penting
83
84
DAFTAR PUSTAKA
Lampiran 1. Distribusi Normal Standar
Kuantitas-kuantitas di dalam tabel adalah P (X ≤ x) = Φ(x)
x
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
0.20
0.21
0.22
0.23
0.24
0.25
0.26
0.27
0.28
0.29
0.30
Φ(x)
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.6179
x
0.31
0.32
0.33
0.34
0.35
0.36
0.37
0.38
0.39
0.40
0.41
0.42
0.43
0.44
0.45
0.46
0.47
0.48
0.49
0.50
0.51
0.52
0.53
0.54
0.55
0.56
0.57
0.58
0.59
0.60
0.61
Φ(x)
0.6217
0.6255
0.6293
0.6331
0.6368
0.6406
0.6443
0.6480
0.6517
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808
0.6844
0.6879
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157
0.7190
0.7224
0.7257
0.7291
x
0.62
0.63
0.64
0.65
0.66
0.67
0.68
0.69
0.70
0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.78
0.79
0.80
0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90
0.91
0.92
Φ(x)
0.7324
0.7357
0.7389
0.7422
0.7454
0.7486
0.7517
0.7549
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.7764
0.7794
0.7823
0.7852
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.8051
0.8078
0.8106
0.8133
0.8159
0.8186
0.8212
x
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1.00
1.01
1.02
1.03
1.04
1.05
1.06
1.07
1.08
1.09
1.10
1.11
1.12
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20
1.21
1.22
1.23
Φ(x)
0.8238
0.8264
0.8289
0.8315
0.8340
0.8365
0.8389
0.8413
0.8438
0.8461
0.8485
0.8508
0.8531
0.8554
0.8577
0.8599
0.8621
0.8643
0.8665
0.8686
0.8708
0.8729
0.8749
0.8770
0.8790
0.8810
0.8830
0.8849
0.8869
0.8888
0.8907
DAFTAR PUSTAKA
85
Lanjutan Distribusi Normal Standar
x
1.24
1.25
1.26
1.27
1.28
1.29
1.30
1.31
1.32
1.33
1.34
1.35
1.36
1.37
1.38
1.39
1.40
1.41
1.42
1.43
1.44
1.45
1.46
1.47
1.48
1.49
1.50
1.51
1.52
1.53
1.54
Φ(x)
0.8925
0.8944
0.8962
0.8980
0.8997
0.9015
0.9032
0.9049
0.9066
0.9082
0.9099
0.9115
0.9131
0.9147
0.9162
0.9177
0.9192
0.9207
0.9222
0.9236
0.9251
0.9265
0.9279
0.9292
0.9306
0.9319
0.9332
0.9345
0.9357
0.9370
0.9382
x
1.55
1.56
1.57
1.58
1.59
1.6
1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.8
1.81
1.82
1.83
1.84
1.85
Φ(x)
0.9394
0.9406
0.9418
0.9429
0.9441
0.9452
0.9463
0.9474
0.9484
0.9495
0.9505
0.9515
0.9525
0.9535
0.9545
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
0.9608
0.9616
0.9625
0.9633
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
x
1.86
1.87
1.88
1.89
1.90
1.91
1.92
1.93
1.94
1.95
1.96
1.97
1.98
1.99
2.00
2.01
2.02
2.03
2.04
2.05
2.06
2.07
2.08
2.09
2.10
2.11
2.12
2.13
2.14
2.15
2.16
Φ(x)
0.9686
0.9693
0.9699
0.9706
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
0.9750
0.9756
0.9761
0.9767
0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
0.9803
0.9808
0.9812
0.9817
0.9821
0.9826
0.9830
0.9834
0.9838
0.9842
0.9846
x
2.17
2.18
2.19
2.20
2.21
2.22
2.23
2.24
2.25
2.26
2.27
2.28
2.29
2.30
2.31
2.32
2.33
2.34
2.35
2.36
2.37
2.38
2.39
2.40
2.41
2.42
2.43
2.44
2.45
2.46
2.47
Φ(x)
0.9850
0.9854
0.9857
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
0.9881
0.9884
0.9887
0.9890
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
0.9909
0.9911
0.9913
0.9916
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
0.9931
0.9932
86
DAFTAR PUSTAKA
Lanjutan Distribusi Normal Standar
x
2.48
2.49
2.50
2.51
2.52
2.53
2.54
2.55
2.56
2.57
2.58
2.59
2.60
2.61
2.62
2.63
2.64
2.65
2.66
2.67
2.68
2.69
2.70
2.71
2.72
2.73
2.74
2.75
2.76
2.77
2.78
Φ(x)
0.9934
0.9936
0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
0.9948
0.9949
0.9951
0.9952
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
0.9961
0.9962
0.9963
0.9964
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
0.9971
0.9972
0.9973
x
2.79
2.80
2.81
2.82
2.83
2.84
2.85
2.86
2.87
2.88
2.89
2.90
2.91
2.92
2.93
2.94
2.95
2.96
2.97
2.98
2.99
3.00
3.01
3.02
3.03
3.04
3.05
3.06
3.07
3.08
3.09
Φ(x)
0.9974
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
0.9979
0.9979
0.9980
0.9981
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
0.9985
0.9985
0.9986
0.9986
0.9987
0.9987
0.9987
0.9988
0.9988
0.9989
0.9989
0.9989
0.9990
0.9990
x
3.1
3.11
3.12
3.13
3.14
3.15
3.16
3.17
3.18
3.19
3.20
3.21
3.22
3.23
3.24
3.25
3.26
3.27
3.28
3.29
3.3
3.31
3.32
3.33
3.34
3.35
3.36
3.37
3.38
3.39
3.40
Φ(x)
0.9990
0.9991
0.9991
0.9991
0.9992
0.9992
0.9992
0.9992
0.9993
0.9993
0.9993
0.9993
0.9994
0.9994
0.9994
0.9994
0.9994
0.9995
0.9995
0.9995
0.9995
0.9995
0.9995
0.9996
0.9996
0.9996
0.9996
0.9996
0.9996
0.9997
0.9997
x
3.41
3.42
3.43
3.44
3.45
3.46
3.47
3.48
3.49
3.50
3.51
3.52
3.53
3.54
3.55
3.56
3.57
3.58
3.59
3.60
3.61
3.62
3.63
3.64
3.65
3.66
3.67
3.68
3.69
3.70
3.71
Φ(x)
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9998
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
0.9999
DAFTAR PUSTAKA
87
Lampiran 2. Distribusil Chi-Square
Kuantitas-kuantitas dalam tabel adalah bilangan x sehingga P (χ2 ≤ x) = λ
λ
r
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0.99
6.6349
9.2103
11.3449
13.2767
15.0863
16.8119
18.4753
20.0902
21.6660
23.2093
24.7250
26.2170
27.6882
29.1412
30.5779
31.9999
33.4087
34.8053
36.1909
37.5662
38.9322
40.2894
41.6384
42.9798
44.3141
45.6417
46.9629
48.2782
49.5879
50.8922
0.975
5.0239
7.3778
9.3484
11.1433
12.8325
14.4494
16.0128
17.5345
19.0228
20.4832
21.9200
23.3367
24.7356
26.1189
27.4884
28.8454
30.1910
31.5264
32.8523
34.1696
35.4789
36.7807
38.0756
39.3641
40.6465
41.9232
43.1945
44.4608
45.7223
46.9792
0.95
3.8415
5.9915
7.8147
9.4877
11.0705
12.5916
14.0671
15.5073
16.9190
18.3070
19.6751
21.0261
22.3620
23.6848
24.9958
26.2962
27.5871
28.8693
30.1435
31.4104
32.6706
33.9244
35.1725
36.4150
37.6525
38.8851
40.1133
41.3371
42.5570
43.7730
0.05
0.0039
0.1026
0.3518
0.7107
1.1455
1.6354
2.1673
2.7326
3.3251
3.9403
4.5748
5.2260
5.8919
6.5706
7.2609
7.9616
8.6718
9.3905
10.1170
10.8508
11.5913
12.3380
13.0905
13.8484
14.6114
15.3792
16.1514
16.9279
17.7084
18.4927
0.025
0.0010
0.0506
0.2158
0.4844
0.8312
1.2373
1.6899
2.1797
2.7004
3.2470
3.8157
4.4038
5.0088
5.6287
6.2621
6.9077
7.5642
8.2307
8.9065
9.5908
10.2829
10.9823
11.6886
12.4012
13.1197
13.8439
14.5734
15.3079
16.0471
16.7908
0.01
0.0002
0.0201
0.1148
0.2971
0.5543
0.8721
1.2390
1.6465
2.0879
2.5582
3.0535
3.5706
4.1069
4.6604
5.2293
5.8122
6.4078
7.0149
7.6327
8.2604
8.8972
9.5425
10.1957
10.8564
11.5240
12.1981
12.8785
13.5647
14.2565
14.9535
88
DAFTAR PUSTAKA
Lampiran 3. Distribusi t-Student’s
Kuantitas-kuantitas dalam tabel adalah bilangan x sehingga P (tr ≤ x) = λ
r
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
0.9
3.0777
1.8856
1.6377
1.5332
1.4759
1.4398
1.4149
1.3968
1.3830
1.3722
1.3634
1.3562
1.3502
1.3450
1.3406
1.3368
1.3334
1.3304
1.3277
1.3253
1.3232
1.3212
1.3195
1.3178
1.3163
1.3150
1.3137
1.3125
1.3114
1.3104
1.3095
1.3086
1.3077
1.3070
1.3062
1.3055
1.3049
1.3042
1.3036
1.3031
1.3025
1.3020
1.3016
1.3011
1.3006
0.95
6.3138
2.9200
2.3534
2.1318
2.0150
1.9432
1.8946
1.8595
1.8331
1.8125
1.7959
1.7823
1.7709
1.7613
1.7531
1.7459
1.7396
1.7341
1.7291
1.7247
1.7207
1.7171
1.7139
1.7109
1.7081
1.7056
1.7033
1.7011
1.6991
1.6973
1.6955
1.6939
1.6924
1.6909
1.6896
1.6883
1.6871
1.6860
1.6849
1.6839
1.6829
1.6820
1.6811
1.6802
1.6794
λ
0.975
12.7062
4.3027
3.1824
2.7764
2.5706
2.4469
2.3646
2.3060
2.2622
2.2281
2.2010
2.1788
2.1604
2.1448
2.1314
2.1199
2.1098
2.1009
2.0930
2.0860
2.0796
2.0739
2.0687
2.0639
2.0595
2.0555
2.0518
2.0484
2.0452
2.0423
2.0395
2.0369
2.0345
2.0322
2.0301
2.0281
2.0262
2.0244
2.0227
2.0211
2.0195
2.0181
2.0167
2.0154
2.0141
0.99
31.8205
6.9646
4.5407
3.7469
3.3649
3.1427
2.9980
2.8965
2.8214
2.7638
2.7181
2.6810
2.6503
2.6245
2.6025
2.5835
2.5669
2.5524
2.5395
2.5280
2.5176
2.5083
2.4999
2.4922
2.4851
2.4786
2.4727
2.4671
2.4620
2.4573
2.4528
2.4487
2.4448
2.4411
2.4377
2.4345
2.4314
2.4286
2.4258
2.4233
2.4208
2.4185
2.4163
2.4141
2.4121
0.995
63.6567
9.9248
5.8409
4.6041
4.0321
3.7074
3.4995
3.3554
3.2498
3.1693
3.1058
3.0545
3.0123
2.9768
2.9467
2.9208
2.8982
2.8784
2.8609
2.8453
2.8314
2.8188
2.8073
2.7969
2.7874
2.7787
2.7707
2.7633
2.7564
2.7500
2.7440
2.7385
2.7333
2.7284
2.7238
2.7195
2.7154
2.7116
2.7079
2.7045
2.7012
2.6981
2.6951
2.6923
2.6896
DAFTAR PUSTAKA
89
Lanjutan Distribusi t-Student’s
r
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
0.9
1.3002
1.2998
1.2994
1.2991
1.2987
1.2984
1.2980
1.2977
1.2974
1.2971
1.2969
1.2966
1.2963
1.2961
1.2958
1.2956
1.2954
1.2951
1.2949
1.2947
1.2945
1.2943
1.2941
1.2939
1.2938
1.2936
1.2934
1.2933
1.2931
1.2929
1.2928
1.2926
1.2925
1.2924
1.2922
1.2921
1.2920
1.2918
1.2917
1.2916
1.2915
1.2914
1.2912
1.2911
1.2910
0.95
1.6787
1.6779
1.6772
1.6766
1.6759
1.6753
1.6747
1.6741
1.6736
1.6730
1.6725
1.6720
1.6716
1.6711
1.6706
1.6702
1.6698
1.6694
1.6690
1.6686
1.6683
1.6679
1.6676
1.6672
1.6669
1.6666
1.6663
1.6660
1.6657
1.6654
1.6652
1.6649
1.6646
1.6644
1.6641
1.6639
1.6636
1.6634
1.6632
1.6630
1.6628
1.6626
1.6624
1.6622
1.6620
λ
0.975
2.0129
2.0117
2.0106
2.0096
2.0086
2.0076
2.0066
2.0057
2.0049
2.0040
2.0032
2.0025
2.0017
2.0010
2.0003
1.9996
1.9990
1.9983
1.9977
1.9971
1.9966
1.9960
1.9955
1.9949
1.9944
1.9939
1.9935
1.9930
1.9925
1.9921
1.9917
1.9913
1.9908
1.9905
1.9901
1.9897
1.9893
1.9890
1.9886
1.9883
1.9879
1.9876
1.9873
1.9870
1.9867
0.99
2.4102
2.4083
2.4066
2.4049
2.4033
2.4017
2.4002
2.3988
2.3974
2.3961
2.3948
2.3936
2.3924
2.3912
2.3901
2.3890
2.3880
2.3870
2.3860
2.3851
2.3842
2.3833
2.3824
2.3816
2.3808
2.3800
2.3793
2.3785
2.3778
2.3771
2.3764
2.3758
2.3751
2.3745
2.3739
2.3733
2.3727
2.3721
2.3716
2.3710
2.3705
2.3700
2.3695
2.3690
2.3685
0.995
2.6870
2.6846
2.6822
2.6800
2.6778
2.6757
2.6737
2.6718
2.6700
2.6682
2.6665
2.6649
2.6633
2.6618
2.6603
2.6589
2.6575
2.6561
2.6549
2.6536
2.6524
2.6512
2.6501
2.6490
2.6479
2.6469
2.6459
2.6449
2.6439
2.6430
2.6421
2.6412
2.6403
2.6395
2.6387
2.6379
2.6371
2.6364
2.6356
2.6349
2.6342
2.6335
2.6329
2.6322
2.6316
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
db
penyebut
(r2 )
161.4476
18.5128
10.1280
7.7086
6.6079
5.9874
5.5914
5.3177
5.1174
4.9646
4.8443
4.7472
4.6672
4.6001
4.5431
4.4940
4.4513
4.4139
4.3807
4.3512
1
199.5000
19.0000
9.5521
6.9443
5.7861
5.1433
4.7374
4.4590
4.2565
4.1028
3.9823
3.8853
3.8056
3.7389
3.6823
3.6337
3.5915
3.5546
3.5219
3.4928
2
215.7073
19.1643
9.2766
6.5914
5.4095
4.7571
4.3468
4.0662
3.8625
3.7083
3.5874
3.4903
3.4105
3.3439
3.2874
3.2389
3.1968
3.1599
3.1274
3.0984
3
224.5832
19.2468
9.1172
6.3882
5.1922
4.5337
4.1203
3.8379
3.6331
3.4780
3.3567
3.2592
3.1791
3.1122
3.0556
3.0069
2.9647
2.9277
2.8951
2.8661
4
230.1619
19.2964
9.0135
6.2561
5.0503
4.3874
3.9715
3.6875
3.4817
3.3258
3.2039
3.1059
3.0254
2.9582
2.9013
2.8524
2.8100
2.7729
2.7401
2.7109
5
233.9860
19.3295
8.9406
6.1631
4.9503
4.2839
3.8660
3.5806
3.3738
3.2172
3.0946
2.9961
2.9153
2.8477
2.7905
2.7413
2.6987
2.6613
2.6283
2.5990
6
db pembilang (r1 )
7
236.7684
19.3532
8.8867
6.0942
4.8759
4.2067
3.7870
3.5005
3.2927
3.1355
3.0123
2.9134
2.8321
2.7642
2.7066
2.6572
2.6143
2.5767
2.5435
2.5140
Distribusi F
Kuantitas-kuantitas di dalam tabel adalah nilai x sehingga P (Fr1 ,r2 ≤ x) = 0.05
238.8827
19.3710
8.8452
6.0410
4.8183
4.1468
3.7257
3.4381
3.2296
3.0717
2.9480
2.8486
2.7669
2.6987
2.6408
2.5911
2.5480
2.5102
2.4768
2.4471
8
240.5433
19.3848
8.8123
5.9988
4.7725
4.0990
3.6767
3.3881
3.1789
3.0204
2.8962
2.7964
2.7144
2.6458
2.5876
2.5377
2.4943
2.4563
2.4227
2.3928
9
241.8817
19.3959
8.7855
5.9644
4.7351
4.0600
3.6365
3.3472
3.1373
2.9782
2.8536
2.7534
2.6710
2.6022
2.5437
2.4935
2.4499
2.4117
2.3779
2.3479
10
90
DAFTAR PUSTAKA
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
db
penyebut
(r2 )
2
3
4
5
6
7
8
9
10
4052.1807 4999.5000 5403.3520 5624.5833 5763.6496 5858.9861 5928.3557 5981.0703 6022.4732 6055.8467
98.5025
99.0000
99.1662
99.2494
99.2993
99.3326
99.3564
99.3742
99.3881
99.3992
34.1162
30.8165
29.4567
28.7099
28.2371
27.9107
27.6717
27.4892
27.3452
27.2287
21.1977
18.0000
16.6944
15.9770
15.5219
15.2069
14.9758
14.7989
14.6591
14.5459
16.2582
13.2739
12.0600
11.3919
10.9670
10.6723
10.4555
10.2893
10.1578
10.0510
13.7450
10.9248
9.7795
9.1483
8.7459
8.4661
8.2600
8.1017
7.9761
7.8741
12.2464
9.5466
8.4513
7.8466
7.4604
7.1914
6.9928
6.8400
6.7188
6.6201
11.2586
8.6491
7.5910
7.0061
6.6318
6.3707
6.1776
6.0289
5.9106
5.8143
10.5614
8.0215
6.9919
6.4221
6.0569
5.8018
5.6129
5.4671
5.3511
5.2565
10.0443
7.5594
6.5523
5.9943
5.6363
5.3858
5.2001
5.0567
4.9424
4.8491
9.6460
7.2057
6.2167
5.6683
5.3160
5.0692
4.8861
4.7445
4.6315
4.5393
9.3302
6.9266
5.9525
5.4120
5.0643
4.8206
4.6395
4.4994
4.3875
4.2961
9.0738
6.7010
5.7394
5.2053
4.8616
4.6204
4.4410
4.3021
4.1911
4.1003
8.8616
6.5149
5.5639
5.0354
4.6950
4.4558
4.2779
4.1399
4.0297
3.9394
8.6831
6.3589
5.4170
4.8932
4.5556
4.3183
4.1415
4.0045
3.8948
3.8049
8.5310
6.2262
5.2922
4.7726
4.4374
4.2016
4.0259
3.8896
3.7804
3.6909
8.3997
6.1121
5.1850
4.6690
4.3359
4.1015
3.9267
3.7910
3.6822
3.5931
8.2854
6.0129
5.0919
4.5790
4.2479
4.0146
3.8406
3.7054
3.5971
3.5082
8.1849
5.9259
5.0103
4.5003
4.1708
3.9386
3.7653
3.6305
3.5225
3.4338
8.0960
5.8489
4.9382
4.4307
4.1027
3.8714
3.6987
3.5644
3.4567
3.3682
1
derajat bebas pembilang (r1 )
Lanjutan Distrbusi F
Kuantitas-kuantitas di dalam tabel adalah nilai x sehingga P (Fr1 ,r2 ≤ x) = 0.01
DAFTAR PUSTAKA
91
Download