Analisa Data Statistik

advertisement
Analisa Data Statistik
Chap 8: Sampling Distribution
Agoes Soehianie, Ph.D
Daftar Isi





Random Sampling, Populasi
dan Sampel
Mean dan Variansi Sampel
Grafik Tampilan Data
Distribusi Sampel
Kesimpulan (Inferences)
Tentang Mean Populasi
Random Sampling
Suatu proses untuk mengambil sampel secara acak dari populasi.
Secara teknis letak kerumitannya adalah pada proses untuk
menjamin ke-random-an, terutama bilamana sampel berasal dari
populasi yg berunsur manusia.
Ada beberapa teknik sampling yg dikenal:
1. Probabilistik sampling
Setiap anggota populasi memiliki kesempatan yg sama untuk
terpilih.
Variasinya: Simple Random Sampling, Sistematik Random
Sampling, Stratified Random Sampling, Multistage Area Random
Sampling.
2. Non Probabilistik Sampling
Bilamana kesempatan anggota populasi terpilih tidak sama
Variasinya: Quota Sampling, Booster Sampling, Judgement
Sampling, Convenience Sampling, Snow-Ball sampling etc
Proses analisa statistik hanya berlaku untuk probabilistik sampling
Populasi dan Sampel
Keseluruhan obyek atau kejadian yg menjadi sasaran observasi
disebut populasi.
Contoh: penduduk Indonesia, mahasiswa ITB, sekrup diameter 5mm
produksi pabrik X, pengguna HP di Bandung, Penderita AIDS di
Indonesia, umur batuan, tekanan udara di Bandung, curah hujan
di Jawa Barat, dll
Macam populasi :
Diskrit vs Kontinu
Finite vs Infinite
Setiap observasi di populasi adalah NILAI dari variabel random X yg
memiliki distribusi probabilitas tertentu f(x).
Pada banyak kasus sulit/mahal/tidak mungkin untuk melakukan
observasi untuk seluruh anggota populasi, sehingga diperlukan
sampel.
Sampel : himpunan bagian dari populasi.
Statistik
Pada Statistik Inferential ingin diambil kesimpulan tentang parameterparameter populasi (mean, variansi) dari studi terhadap
parameter-parameter sampel.
Statitik adalah sebuah fungsi berdasarkan pada variabel random yg
dihitung dari sampel.
Contoh : mean dan variansi serta STD
Mean sampel
Jika X1, ..,Xn adalah nilai variabel random dari sampel berukuran n
maka mean dari sampel didefinisikan sbg:
n
dengan
1
X   Xk
n k 1
n
Sx   X k
k 1
maka
SX
X
n
Statistik
Variansi sampel
Jika X1, ..,Xn adalah nilai variabel random dari sampel berukuran n
maka mean dari sampel didefinisikan sbg:
n
1
2
S2 
(
X

X
)

k
n  1 k 1
Contoh.
Harga 1kg kopi di empat toko adalah 12,15,17 dan 20. Hitunglah ratarata sampel dan variansinya.
Jawab
X
(X-X)
(X-X)^2
1
12
-4
16
2
15
-1
1
3
17
1
1
4
20
4
16
Sum
64
0
34
average
16
1 n
64
X   X k   16
n k 1
4
1 n
2
S 
(
X

X
)
 k
n  1 k 1
1
 34  11,33
3
2
11.33333
Statistik
Variansi sampel (alternative)
Jika X1, ..,Xn adalah nilai variabel random dari sampel berukuran n
maka variansi dari sampel didefinisikan sbg:
2
n
n

1

 
2
2
S 
n X k    X k   atau
n(n  1)  k 1
 k 1
 
nS xx  ( S x ) 2
S 
n(n  1)
2
Contoh
Hitung ulang variansi contoh sebelumnya dengan rumus ini.
X
Sum
X^2
1
12
144
2
15
225
3
17
289
4
20
400
64
1058
2
n
n


1


2
2
S 
n X k    X k  
n(n  1)  k 1
 k 1
 
S2 


1
4 *1058  64 2  11,33
4(3)
Statistik
Standard Deviasi sampel
Standard Deviasi sampel S adalah akar positif dari variansi!
Soal
Berikut ini adalah IP mahasiswa angkatan 200X dari Prodi Fisika :
3.2
1.9
2.7
2.4
2.8
2.9
3.8
3.0
2.5
3.3
Hitunglah
a) Mean dan variansi sampel
b) Standard deviasi sampel
Ukuran Sebaran (Dispersi)- Quartile
Quartile adalah data yg membawa seluruh sampel menjadi 4 bagian
sama besar. Dikenal 3 quartile:
a. Quartile bawah atau Quartile pertama Q1
Misal Q1 adalah Quartile bawah berarti 25% data ≤ Q1
b.
c.
Quartile tengah atau Quartile kedua Q2 = Median
Misal Q2 adalah Median berarti 55% data ≤ Q2
Quartile atas atau Quartile ketiga Q3
Misal Q3 adalah Quartile atas berarti 75% data ≤ Q4
Inter Quartile Range (IQR) = Q3-Q1
Cara menentukan Quartile Q1:
1. Urutkan data Xk dari nilai terendah hingga tertinggi
2. Hitung nomor urut data untuk Q1, yaitu k=n/4
Jika k bilangan bulat maka Q1 = (Xk+Xk+1)/2
Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di
atas k, maka Q1 = Xk’
Ukuran Sebaran (Dispersi)- Quartile
Cara menentukan Quartile Q2:
1. Urutkan data Xk dari nilai terendah hingga tertinggi
2. Hitung nomor urut data untuk Q2, yaitu k=n/2
Jika k bilangan bulat maka Q2 = (Xk+Xk+1)/2
Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di
atas k, maka Q2 = Xk’
Cara menentukan Quartile Q3:
1. Urutkan data Xk dari nilai terendah hingga tertinggi
2. Hitung nomor urut data untuk Q3, yaitu k=3n/4
Jika k bilangan bulat maka Q3 = (Xk+Xk+1)/2
Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di
atas k, maka Q3 = Xk’
Quartile - Contoh
Contoh. Misalkan data nilai Fisika 16 anak adalah sbb:
1
2
3
4
5
6
7
8
9
10
11 12 13
14 15 16
23 34 45 51 56 60 61 64 70 71 73 76 82 83 90 99
n=16
Q1: k=n/4 = 16/4 =4, maka Q1 = (X4+X5)/2 = (51+56)/2 = 53.5
Q2: k=n/2 = 16/2 =8, maka Q2 = (X8+X9)/2 = (64+70)/2 = 67
Q3: k=3n/4 = 3*16/4 =12, maka Q3 = (X12+X13)/2 = (76+82)/2 = 79
IQR = Q3-Q1 = 79-53.5 = 25.5
Outliers
Outliers adalah data yg berbeda jauh dari data kebanyakan atau jauh
dari mean atau median. Ada beberapa kebiasaan dalam
menentukan outliers misalkan:
data di luar x ±3S di anggap outliers
data X > Q3 +1.5 IQR atau X < Q1 - 1.5 IQR
dianggap outliers
Titik ekstrem
X disebut titik extrem jika > Q3 + 3 IQR, atau
X disebut titik extrem jika < Q1 -d 3 IQR
Persentile Pα
Jika C adalah persentile ke α (Pα) , artinya sebanyak α data ≤ C.
Jadi P0.5 = Median, P0.25=Q1 dan P0.75 =Q3.
Cara mencari Pα dari n buah data
1. Urutkan data
2. Hitung k = αn
Jika k bulat maka Pα = (Xk+Xk+1)/2
Jika k tak bulat, definisikan k’ bilangan bulat terdekat diatas k,
maka Pα=Xk’
Box-Whisker Plot - Contoh
Example
Berikut ini adalah kadar Nikotin
Quartile
dalam 40 sampel rokok yg dipelajari. k = 40/4 = 10
No
Nikotin
No
Nikotin
No
Nikotin
No
Nikotin
1
0.68
11
1.49
21
1.92
31
2.16
2
0.85
12
1.5
22
1.92
32
2.18
3
0.9
13
1.5
23
1.97
33
2.22
4
1.14
14
1.52
24
1.98
34
2.24
5
1.15
15
1.56
25
1.99
35
2.32
6
1.2
16
1.64
26
2
36
2.35
7
1.23
17
1.67
27
2.01
37
2.5
8
1.28
18
1.79
28
2.08
38
2.62
9
1.38
19
1.82
29
2.09
39
2.68
10
1.48
20
1.84
30
2.12
40
2.7
0.765
Q1 = (X10+X11)/2=1.485
k = 40/2 = 20
Q2 = (X20+X21)/2=1.86
k = 3*40/4 = 30
Q3 = (X30+X31)/2=2.14
IQR = Q3-Q1 =0.655
P0.025 =(X1+X2)/2=0.765
P0.975 = (X39+X40)/2=2.69
1.485
1.86
2.14
2.69
Box-Whisker Plot - Perbandingan
Quantile Plot
Quantile dari sampel dinyatakan oleh q(f) adalah batas nilai q yang
menyatakan sebanyak fraksi f dari data bernilai kurang dari atau
sama dengan q.
Jadi:
q(0.25)= Q1
q(0.5) = Q2=median
q(0.75) = Q3 dst
Quantile Plot memplot nilai data di sumbu tegak thd nilai quantile-nya
Quantile Plot - Example
Data untuk Quantile plot.
Berikut ini data dari 30 sampel @5 data tentang ketebalan cat.
Sampel
Sample
1
29
36
39
34
34
16
35
30
35
29
37
2
29
29
28
32
31
17
40
31
38
35
31
3
34
34
39
38
37
18
35
36
30
33
32
4
35
37
33
38
41
19
35
34
35
30
36
5
30
29
31
38
29
20
35
35
31
38
36
6
34
31
37
39
36
21
32
36
36
32
36
7
30
35
33
40
36
22
36
37
32
34
34
8
28
28
31
34
30
23
29
34
33
37
35
9
32
36
38
38
35
24
36
36
35
37
37
10
35
30
37
35
31
25
36
30
35
33
31
11
35
30
35
38
35
26
35
30
29
38
35
12
38
34
35
35
31
27
35
36
30
34
36
13
34
35
33
30
34
28
35
30
36
29
35
14
40
35
34
33
35
29
38
36
35
31
31
15
34
35
38
35
30
30
30
34
40
28
30
Quantile Plot - Example
Untuk membuat Quantile Plot.
1. Urutkan 1-150 data tsb
2. Buat frequency kumulatif dari data tsb
3. Plot Kumulatif freq vs data tsb
Tabel disamping menunjukkan sebagian
Bagian awal distribusi kumulatif.
Freq
Kum
Data
0.006667
28
0.013333
28
0.02
28
0.026667
28
0.033333
29
0.04
29
0.046667
29
0.053333
29
0.06
29
0.066667
29
0.073333
29
0.08
29
0.086667
29
Quantile Plot
Quantile Plot
Q1
Q2
Q3
41
39
Quantile
37
35
33
31
29
27
0
0.25
0.5
fraksi
0.75
1
Deteksi Penyimpangan dari Normal

Normal Quantile-Quantile Plot
Quantile plot dipakai untuk
membandingkan distribusi
sebuah sampel dengan
distribusi teoretik.
Normal quantile-quantile plot
adalah plot dari data terurut yi
dengan standard normal
quantile q(fi), yg didefinisikan:
q(fi) = 4.91[ f0.14 – (1-f)0.14]
Dengan fi adalah dimana i adalah
nomor urut data:
i 3/8
fi 
n 1/ 4
fi
i
(i-3/8)/(n+1/4)
q
Data
1
0.00416
-2.6281
28
2
0.010815
-2.2973
28
3
0.017471
-2.11174
28
4
0.024126
-1.97829
28
5
0.030782
-1.87247
29
6
0.037438
-1.78396
29
7
0.044093
-1.70739
29
8
0.050749
-1.63958
29
9
0.057404
-1.57849
29
10
0.06406
-1.52272
29
11
0.070715
-1.4713
29
12
0.077371
-1.42347
29
Normal Q-Q Plot
Normal Q-Q Plot
41
39
Quantile
37
35
33
31
29
27
-3
-2
-1
0
Standard Normal Quantile
1
2
3
Menarik Kesimpulan Ttg Populasi Dari Sampel
Ketika sebuah sampel random diambil dari populasi dengan rata-rata
populasi μ, maka rata-rata yg diperoleh dari sampel x akan berfluktuasi
di sekitar rata-rata populasi.
Statistik inferensial berusaha untuk mengambil kesimpulan tentang
parameter-parameter populasi berdasarkan informasi yg diperoleh dari
sampel.
Distribusi Sampling
Yg dimaksud distribusi sampling adalah distribusi probabilitas dari
sebuah statistik.
Jadi distribusi probabilitas dari rata-rata sampel
sampling dari rata-rata sampel
x dinamakan distribusi
Distribusi Sampling dari Rata-Rata
Dari populasi terdistribusi normal dengan rata-rata μ dan variansi σ2
diambil sampel random berukuran n. Misal diperoleh rata-rata sampel
tsb x Bilamana diambil sampel berkali-kali masing-masing berukuran n,
akan diperoleh distribusi rata-rata sampel:
x1 , x2 , x3 , x4 ,..., xm
Rata-rata sampel ini akan terdistribusi normal juga dengan rata-rata = μ:
x  
yaitu rata-rata populasi dan variansi distribusi rata-rata sampelnya:
 x2 
2
n
Contoh
Bolam lampu yg diproduksi sebuah pabrik terdistribusi normal dengan
rata-rata umur 800 jam dan standard deviasi 40 jam. Carilah
probabilitasnya bahwa sampel random 16 bolam akan memiliki rata-rata
umur lampu kurang dari 775 jam.
Jawab.
Distribusi rata-rata sampel akan terdistribusi normal dengan rata-rata

40
 x  800
dan standard deviasi  x 

 10
n
16
Untuk
x  775  Z 
x  X
X
775  800

 2.5
10
Sehingga probabilitas P(x<775) = P(z<-2.5) = 0.0062 (tabel)
Teori Limit Pusat

Jika x adalah rata-rata dari sebuah sampel random berukuran n yg
ditarik dari populasi dengan rata-rata μ dan variansi σ2, maka
bentuk limit dari distribusi variabel
x
z
/ n
dengan n ∞ adalah distribusi normal standard n(z;0,1)
Ini berarti tanpa harus mengetahui bagaimanakah bentuk distribusi
dari populasi, distribusi rata-rata sampelnya akan mendekati
bentuk distribusi normal!
Jika populasinya mengikuti distribusi normal, tak peduli ukuran
sampel distribusi rata-rata sampel akan mengikuti distribusi
normal.
Tetapi jika distribusi populasinya tidak normal maka distribusi rata-rata
sampel akan bagus mendekati normal jika n≥30 pada umumnya
Ilustrasi: Teori Limit Pusat (Normalitas)
n besar (hampir
normal)
Distribusi ratarata sampel
n=1
n kecil ke
moderate
rata-rata sampel
Aplikasi : Taksiran Rata-Rata Populasi

Jika xs adalah rata-rata dari sebuah sampel random berukuran n yg ditarik
dari populasi dengan rata-rata μ dan variansi σ2, maka bentuk limit dari
distribusi variabel
xs  
z
/ n




dengan n ∞ adalah distribusi normal standard n(z;0,1)
Ini berarti tanpa harus mengetahui bagaimanakah bentuk distribusi dari
populasi, distribusi rata-rata sampelnya akan mendekati bentuk distribusi
normal!
Jika populasinya mengikuti distribusi normal, tak peduli ukuran sampel
distribusi rata-rata sampel akan mengikuti distribusi normal.
Tetapi jika distribusi populasinya tidak normal maka distribusi rata-rata
sampel akan bagus mendekati normal jika n≥30 pada umumnya
Taksiran Rata-Rata Populasi








Contoh.
Sebuah pabrik sparepart mobil, yg berupa silinder harus
memproduksi silindernya dengan diameter rata-rata 5.0mm. Dalam
sebuah studi 100 silinder yg diproduksi dipilih secara random.
Ternyata didapati rata-rata diameter sampelnya xs = 5.027mm.
Diketahui bahwa standard deviasi populasi untuk diameter adalah
0.1mm. Apakah hasil dari sampel tsb mendukung statement bahwa
rata-rata diameter di populasi 5.0mm?
Jawab.
Pertanyaan ini akan dijawab dg jalan pemikiran demikian, jika benar
rata-rata populasi μ=5 berapakah probabilitasnya untuk
mendapatkan rata-rata sampel yg berukuran 100 buah lebih dari atau
sama dengan 5.027?
P(xs≥5.027) =?
Zs = (Xs-μ)/(σ/√n) = (5.027-5)/(0.1/ √100) = 0.027/0.01=2.7
P(xs≥5.027) = P(Zs ≥ 2.7) =1- P(Z<2.7)= 0.0035 (dari tabel normal)
Jadi probabilitasnya menemukan rata-rata sampel ≥ 5.027 hanya
0.35%. Berarti hasil studi thd sampel sangat tidak mendukung
konjecture bahwa rata-rata populasi 5.0. Menurut Anda kemungkinan
rata-rata populasi lebih kecil atau lebih besar dari 5.0?
Distribusi Sampling Selisih Dua Buah
Rata-rata

Dalam membandingkan dua buah populasi maka yg dipelajari
adalah selisih rata-rata dua buah populasi tsb μ1 – μ2.
Populasi 1
μ1 , σ 1
Populasi 2
μ2 , σ 2
Xs2 , S2, n2
Xs1 , S1, n1
Distribusi Sampling Selisih Dua Buah
Rata-rata



Distribusi rata-rata sampel xs1 akan hampir normal dengan ratarata μ1 dan variansi σ1x2 =σ12/n1
Distribusi rata-rata sampel xs2 akan hampir normal dengan ratarata μ2 dan variansi σ2x2 =σ22/n2
Maka distribusi variabel selisih rata-rata sampel xs1-xs2 akan
terdistribusi hampir normal juga dengan rata-rata:
μx1-x2 = μ1 – μ2
dan variansi:
σ2x1-x2 = σ1x2 + σ2x2 = σ12/n1 + σ22/n2
Sehingga variabel standard Z:
Z
( xs1  xs 2 )  ( 1   2 )
 12
n1
Akan terdistribusi normal standard

 22
n2
Contoh

Waktu pengeringan dua buah jenis cat disurvei. Cat jenis A diambil
sampel acak 18 buah, demikian juga cat B juga diambil 18 sampel.
Asumsi yg dipercaya adalah rata-rata populasi waktu pengeringan
kedua jenis cat tsb adalah sama. Diketahui standard deviasi waktu
pengeringannya sama yaitu 1 jam. Berapakah probabilitas
mendapati bahwa waktu pengeringan sampel A akan lebih lama
dari 1 jam dibandingkan sampel B dalam kasus ini?
Jawab:
Populasi:
μA = μB
σA = σB = 1
Sampel: nA = nB = 18
( xs1  xs 2 )  ( 1   2 )
1 0
Z


 3.0
P(xsA-xsB > 1)?
2
2
2
2
1  2
1 1


Batasnya xsA-xsB =1, nilai Z yg terkait:
n1 n2
18 18
P(xsA-xsB > 1)= P(Z>3.0)=1-P(Z<3.0)=1-0.9987=0.0013
Soal

Waktu hidup tabung televisi Merk A 6.5tahun, dengan standard
deviasi 0.9 tahun. Sedangkan Merk B umur rata-ratanya 6.0 tahun
dan standard deviasi 0.8 tahun. Berapakah probabilitasnya sampel
random sebanyak 36 tabung merk A akan memiliki rata-rata umur
tabung paling tidak 1 tahun lebih lama dibandingkan umur tabung
yg dihitung dari sampel random merk B sebanyak 49 buah?
Distribusi Sampling Variansi S2


Bilamana ingin dipelajari variasi dari data maka fokus studi adalah
pada distribusi variansi sampel S2 untuk mendapatkan kesimpulan
tentang variansi populasi σ2.
Sampel random berukuran n diambil dari populasi normal dengan
rata-rata μ dan variansi σ2. Diperolah bahwa variansi sampel S2.
Maka statistik :
 
2

(n  1)S 2

2
n

k 1
( X k  X )2
2
Akan memiliki distribusi chi-squared dengan derajat kebebasan
ν=n-1.
Distribusi Chi-Squared

Ditabelkan nilai variabel χ2 yang terkait dengan luas (α) ekor kanan
dari distribusi chi-squared untuk berbagai derajat kebebasan.
 
2
(n  1) S 2
2
α
χα2
χ2
Tabel Distribusi Chi-Squared

Tabel nilai kritikal χ2α yang terkait dengan luas (α) ekor kanan dari
distribusi chi-squared untuk berbagai derajat kebebasan (v)
Contoh.

Pabrik aki menggaransi bahwa aki-nya tahan rata-rata 3 tahun
dengan standard deviasi 1 tahun. Misalkan bahwa umur aki
mengikuti distribusi normal. Diambil sampel acak 5 buah aki, dan
ternyata umurnya 1.9, 2.4, 3.0, 3.5 dan 4.2 tahun. Periksalah apakah
klaim pabrik bahwa standard deviasinya 1 tahun valid?
X2
X

Jawab.
Pertama hitung variansi sampel:
2
n
n


1


2
2
S 
n X k    X k  
n(n  1)  k 1
 k 1
 
S2 


1
5 * 48.26  152  0.815
5(5  1)
SUM
 
2
(n  1) S 2
2
(5  1) * 0.815

 3.26
2
1
1.9
3.61
2.4
5.76
3
9
3.5
12.25
4.2
17.64
15
48.26
225
Sum^2
S2=
(nSxx- Sx^2)/(n*n-1)
S2=
0.815
Contoh.

Dari tabel kita melihat bahwa jika derajat kebebasan v=4, maka 95%
dari nilai-nilai χ2 akan berada diantara :
2.5%
2.5%
95%
χ0..9752
χ0..0252
χ2
Dari tabel χ20.025 (v=4) = 11.143
 Dari tabel χ20.975 (v=4) = 0.484
Dengan σ2=1 dan v=4 ternyata terdapat probabilitas 95% bahwa S2
akan terletak antara 0.484 dan 11.143. Ternyata perhitungan
menghasilkan sampel kita memiliki nilai χ2=3.26, Jadi sampel
mendukung klaim bahwa variansi populasi =1.

Sampel Kecil: Student’s t Distribution

Pada banyak kasus sering dijumpai tidak tersedia informasi
tentang varia,nsi populasi, sehingga dipergunakan variansi yg
berasal dari sampel sebagai pengganti S. Bilamana sampel
berukuran besar (n≥30) maka penggantian σ dengan S cukup
baik dan kita bisa mempergunakan variabel normal Z spt biasa
dalam perhitungan:
Z

X 
S/ n
Jikalau sampel kecil (n<30) maka S2 akan berfluktuasi cukup
besar dari sampel ke sampel sehingga perlu statistik yg lebih baik.
Jika sampel kecil akan tetapi berasal dari distribusi normal, maka
statistik T berikut ini:
X 
T
S/ n
Sampel Kecil: Student’s t Distribution

Variabel T tsb akan mengikuti distribusi probabilitas yg disebut
Distribusi Student T (Student adalah nama samaran dari penemu
distribusi ini yg bernama Gosset), dengan derajat kebebasan v=n1. Distribusi ini bentuknya serupa sekali dengan distribusi normal:
rata-rata=0 dan bentuknya simetrik. Akan tetapi untuk sampel
kecil maka ekor distribusinya lebih tinggi dibandingkan distribusi
normal, jadi bentuknya ditentukan oleh derajat kebebasan.
ν=∞
ν=2
0
t
Tabel Student’s t Distribution

Tabel distribusi student diberikan untuk nilai kritis t yg terkait
dengan luas ekor kanan dari distribusi t, untuk berbagai nilai
derajat kebebasan yg berbeda.
Contoh.

Seorang peneliti menyatakan rata-rata hasil panen setelah diberi
pupuk adalah 500 gram per mm pupuk yg diberikan. Dia kemudian
mengambil sampel 25 batch panen, dan memutuskan dia akan
puas dengan klaimnya jikalau ternyata nilai t dari sampel terletak
antara –t0.05 s/d t0.05. Peneliti tsb mengasumsikan bahwa bobot hasil
panen mengikuti distribusi normal. Ternyata sampelnya memiliki
rata-rata 518 gram dengan standard deviasi sampel 40. Apakah dia
akan puas dengan klaimnya?
Jawab.
Ini adalah persoalan distribusi student t. Ukuran sampel n=25,
sehingga derajat kebebasan ν=n-1=25-1=24. Dari tabel diketahui
bahwa untuk v=24, maka t0.05 = 1.711, sedangkan hasil sampelnya
memberikan

X   518  500
T

 2.25
S / n 40 / 25
Kegunaan Distribusi Student t

1.
2.
3.
Distribusi student t biasanya digunakan dalam:
Kesimpulan ttg rata-rata populasi
Perbandingan antara dua buah rata-rata sampel
dll
Distribusi F
Salah satu perbandingan yg dilakukan dalam statistik adalah
perbandingan variabilitas atau variansi dari dua buah sampel.
Statistik yg dipergunakan dalam membandingkan variansi 2 buah
sampel dinamakan distribusi F.
Jika S12 dan S22 adalah variansi dari 2 buah sampel random yg tak
saling bergantung (independen) dengan ukuran n1 dan n2 yg
diambil dari populasi normal dengan variansi σ12 dan σ22, maka
statistik F:
2
2
S1 /  1
F 2 2
S2 /  2
Mengikuti distribusi F dengan derajat kebebasan v1=n1-1 dan v2=n2-1.
Distribusi F bersifat asimetrik . bentuknya bergantung pada derajat
kebebasannya
Perbandingan Variansi: Distribution F
ν=(10,30)
ν=(6,10)
0
α
f
0
fα
Jika fα (v1,v2) menyatakan nilai kritis f dengan luas ekor kanan α untuk
derajat kekebasan v1,v2, maka: (perhatikan urutan v1 dan v2)
f1 ( 2 , 1 ) 
1
f ( 1 , 2 )
Tabel Distribusi F
Karena ada dua derajat kebebasan yg menentukan bentuk Distribusi F
maka, tabel distribusi lebih terbatas, hanya ditabelkan nilai kritis F
untuk beberapa nilai luas ekor kanan yg populer dipakai (misalnya
α=5%)
Kegunaan Distribusi F
Nanti distribusi F akan dipakai untuk memeriksa kesamaan rata-rata
dari beberapa grup sampel yg diambil secara independen. Ada dua
faktor yg akan menentukan apakah perbedaan rata-rata sampel
memang nyata atau tidak yaitu:
1. Variasi di dalam sampel (within)
2. Variasi antar sampel (between)
X1
X2
X3
X
Download