abstrak

advertisement
perpustakaan.uns.ac.id
digilib.uns.ac.id
PERBANDINGAN UJI KENORMALAN
PADA KATEGORI FUNGSI DISTRIBUSI EMPIRIS
MENGGUNAKAN METODE SIMULASI MONTE CARLO
oleh
ANNA ZAMMADUITA
M0109010
SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan
memperoleh gelar Sarjana Sains Matematika
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
commit
to user
2013
i
perpustakaan.uns.ac.id
digilib.uns.ac.id
commit to user
ii
perpustakaan.uns.ac.id
digilib.uns.ac.id
ABSTRAK
Anna Zammaduita, 2013. PERBANDINGAN UJI KENORMALAN PADA
KATEGORI FUNGSI DISTRIBUSI EMPIRIS MENGGUNAKAN METODE
SIMULASI MONTE CARLO. Fakultas Matematika dan Ilmu Pengetahuan
Alam, Universitas Sebelas Maret.
Uji kenormalan berdasarkan pada fungsi distribusi empiris ada empat yaitu uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.
Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan
adanya perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk dibandingkan. Perbandingan uji-uji tersebut didasarkan pada kekuatan uji
masing-masing. Kekuatan uji merupakan besarnya probabilitas menolak H0 ketika H0 salah. Dengan melakukan simulasi Monte Carlo terhadap distribusi yang
tidak normal, dapat diperoleh banyaknya H0 yang ditolak.
Tujuan penelitian ini adalah memperoleh perbandingan uji kenormalan pada ketegori fungsi distribusi empiris. Berdasarkan hasil simulasi Monte Carlo, urutan kepekaan uji kenormalan pada kategori fungsi distribusi empiris dari yang tertinggi adalah uji Anderson-Darling, Cramer-von Mises, Kuiper, dan
Kolmogorov-Smirnov. Ini berarti uji Anderson-Darling paling peka dalam mendeteksi ketidaknormalan.
Kata kunci : uji Kolmogorov-Smirnov, uji Kuiper, uji Cramer-von Mises, uji
Anderson-Darling, fungsi distribusi empiris.
commit to user
iii
perpustakaan.uns.ac.id
digilib.uns.ac.id
ABSTRACT
Anna Zammaduita, 2013. A COMPARISON OF NORMALITY TEST ON
EMPIRICAL DISTRIBUTION FUNCTION CATEGORIES USING MONTE
CARLO SIMULATION METHOD. Faculty of Mathematics and Natural Sciences, Sebelas Maret University.
There are four normality tests based on empirical distribution function.
These are Kolmogorov Smirnov test, Kuiper test, Cramer-von Mises test, and
Anderson-Darling test which have different test statistics. Thus, some tests have
different conclusions. Therefore, in this research, the four tests are compared.
The comparison of the tests is based on the power of each test. The power of
the test is the probability for rejecting H0 when H0 is false. Using Monte Carlo
simulation to the non-normal distribution, it can be acquired the number of H0
which is rejected.
The objective of this research is to obtain the comparison of normality test
on the empirical distribution function categories. Based on the results of Monte
Carlo simulations, the order of the sensitivity tests of normality on the empirical distribution function categories from the most sensitive is Anderson-Darling,
Cramer-von Mises, Kuiper, and the Kolmogorov-Smirnov. It can be concluded
that Anderson-Darling test is the most sensitive normality test in detecting the
non-normality.
Key words : Kolmogorov-Smirnov test, Kuiper test, Cramer-von Mises test,
Anderson-Darling test, empirical distribution function.
commit to user
iv
perpustakaan.uns.ac.id
digilib.uns.ac.id
MOTO
Sesungguhnya sesudah kesulitan itu ada kemudahan (Q.S. Al Insyirah : 6)
Selalu ada jalan keluar dari setiap masalah selama ada usaha dan doa
commit to user
v
perpustakaan.uns.ac.id
digilib.uns.ac.id
PERSEMBAHAN
Sebuah karya sederhana ini saya persembahkan untuk
Ibu, Bapak, dan Kakak sebagai wujud atas doa, semangat, keringat, dan
pengorbanan yang diberikan.
commit to user
vi
perpustakaan.uns.ac.id
digilib.uns.ac.id
KATA PENGANTAR
Segala puji dan syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan skripsi
ini. Selain itu, penulis juga mengucapkan terima kasih kepada Bapak Drs. Sugiyanto, M.Si. selaku Dosen Pembimbing I dan Ibu Dra. Purnami Widyaningsih,
M.App.Sc. selaku Dosen Pembimbing II atas bimbingannya dalam penyusunan
skripsi ini.
Semoga skripsi ini dapat bermanfaat.
Surakarta,
Maret 2013
Penulis
commit to user
vii
perpustakaan.uns.ac.id
digilib.uns.ac.id
Daftar Isi
I
ABSTRAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iii
ABSTRACT
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iv
MOTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
PERSEMBAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vi
KATA PENGANTAR . . . . . . . . . . . . . . . . . . . . . . . . . . .
vii
DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ix
DAFTAR TABEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xi
DAFTAR GAMBAR . . . . . . . . . . . . . . . . . . . . . . . . . . . .
xii
PENDAHULUAN
1
1.1
Latar Belakang Masalah . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Perumusan Masalah
. . . . . . . . . . . . . . . . . . . . . . . . .
3
1.3
Batasan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.4
Tujuan Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.5
Manfaat Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . .
4
II LANDASAN TEORI
5
2.1
Tinjauan Pustaka . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.2
Teori-Teori Penunjang . . . . . . . . . . . . . . . . . . . . . . . .
6
2.2.1
Konsep Dasar Statistika . . . . . . . . . . . . . . . . . . .
6
2.2.2
Distribusi Probabilitas Kontinu Khusus . . . . . . . . . . .
7
2.2.3
Fungsi Distribusi Empiris . . . . . . . . . . . . . . . . . .
11
2.2.4
Uji Hipotesis . .commit
. . . . to. user
. . . . . . . . . . . . . . . . . .
11
2.2.5
Uji Kenormalan . . . . . . . . . . . . . . . . . . . . . . . .
12
viii
perpustakaan.uns.ac.id
2.3
digilib.uns.ac.id
2.2.6
Uji Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . .
14
2.2.7
Uji Kuiper . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2.2.8
Uji Cramer-von Mises . . . . . . . . . . . . . . . . . . . .
15
2.2.9
Uji Anderson-Darling . . . . . . . . . . . . . . . . . . . . .
16
2.2.10 Simulasi Monte Carlo . . . . . . . . . . . . . . . . . . . . .
17
Kerangka Pemikiran . . . . . . . . . . . . . . . . . . . . . . . . .
18
III METODE PENELITIAN
19
IV PEMBAHASAN
22
4.1
Prosedur Pengujian . . . . . . . . . . . . . . . . . . . . . . . . . .
22
4.2
Perbedaan Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . .
26
4.3
Simulasi Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . .
34
4.3.1
Sampel Berdistribusi Eksponensial . . . . . . . . . . . . .
35
4.3.2
Sampel Berdistribusi Chi-Kuadrat . . . . . . . . . . . . . .
35
4.3.3
Sampel Berdistribusi Gamma . . . . . . . . . . . . . . . .
39
4.3.4
Sampel Berdistribusi Beta . . . . . . . . . . . . . . . . . .
42
4.3.5
Sampel Berdistribusi Uniform . . . . . . . . . . . . . . . .
42
V PENUTUP
48
5.1
Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
5.2
Saran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
DAFTAR PUSTAKA
49
LAMPIRAN
52
commit to user
ix
perpustakaan.uns.ac.id
digilib.uns.ac.id
Daftar Tabel
2.1
Persentase dari sampel yang dapat ditolak untuk masing-masing
uji kenormalan dengan ukuran sampel berbeda
. . . . . . . . . .
6
2.2
Nilai kritis D∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2.3
Nilai kritis V ∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2∗
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
4.1
Data bangkitan pertama . . . . . . . . . . . . . . . . . . . . . . .
27
4.2
Data terurut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
4.3
Perhitungan D∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
4.4
Perhitungan W 2
2.4
Nilai kritis W
2.5
Nilai kritis A2
∗
2∗
∗
. . . . . . . . . . . . . . . . . . . . . . . . . . .
30
4.5
Perhitungan A
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
4.6
Data bangkitan kedua . . . . . . . . . . . . . . . . . . . . . . . .
31
4.7
Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi eksponensial . . . . . . . . . . . . . . . . . . . . . .
4.8
36
Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi chi-kuadrat . . . . . . . . . . . . . . . . . . . . . . .
4.9
38
Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi gamma . . . . . . . . . . . . . . . . . . . . . . . . .
commit to user
x
40
perpustakaan.uns.ac.id
digilib.uns.ac.id
4.10 Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi beta
. . . . . . . . . . . . . . . . . . . . . . . . . .
43
4.11 Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi uniform . . . . . . . . . . . . . . . . . . . . . . . . .
commit to user
xi
46
perpustakaan.uns.ac.id
digilib.uns.ac.id
Daftar Gambar
2.1
Kurva normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.2
Fungsi distribusi empiris dan fungsi distribusi kumulatif normal .
13
3.1
Diagram alir simulasi
21
4.1
Persentase menolak H0 dari sampel berdistribusi eksponensial de-
. . . . . . . . . . . . . . . . . . . . . . . .
ngan parameter θ = 7 untuk n = 10, 20, ..., 100
4.2
. . . . . . . . . .
Persentase menolak H0 dari sampel berdistribusi chi-kuadrat dengan derajat bebas ν = 3 untuk n = 10, 20, ..., 100
4.3
. . . . . . . .
41
Persentase menolak H0 dari sampel berdistribusi beta dengan parameter a = 3 dan b = 1 untuk n = 10, 20, ..., 100 . . . . . . . . .
4.5
39
Persentase menolak H0 dari sampel berdistribusi gamma dengan
parameter θ = 3 dan κ = 5 untuk n = 10, 20, ..., 100 . . . . . . . .
4.4
37
44
Persentase menolak H0 dari sampel berdistribusi uniform dengan
parameter interval a = 3 dan b = −3 untuk n = 10, 20, ..., 100
commit to user
xii
. .
45
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab I
PENDAHULUAN
1.1
Latar Belakang Masalah
Menurut Supranto [22], statistika adalah ilmu yang mempelajari cara pengumpulan, pengolahan, penyajian, dan analisis data agar menghasilkan suatu
informasi yang berguna dan mudah dipahami. McClave [14] mengemukakan ada
dua macam statistika yaitu statistika deskriptif dan statistika inferensi. Statistika
deskriptif membahas metode pengumpulan, penyajian, dan pengukuran pemusatan serta penyebaran suatu data. Sementara itu, statistika inferensi membahas
mengenai cara menganalisis data serta mengambil kesimpulan yang berkaitan
dengan estimasi parameter dan pengujian hipotesis.
Statistika inferensi dibagi dalam dua kelompok yaitu statistika parametrik
dan statistika nonparametrik. Statistika parametrik bergantung pada asumsiasumsi tertentu. Dalam berbagai permasalahan, terdapat satu asumsi yang tetap
yaitu sampel acak berasal dari populasi berdistribusi normal (kenormalan data).
Misal pada uji t dan analisis variansi yang menggunakan asumsi kenormalan
data. Sebaliknya, statistika nonparametrik tidak bergantung pada asumsi-asumsi
tertentu (Daniel [8]).
Razali dan Wah [15] menunjukkan ada dua cara untuk melihat kenormalan
data yaitu secara visual dan uji statistik. Kenormalan data secara visual dapat
ditampilkan dengan histogram dan plot probabilitas normal tetapi hasilnya bersifat subjektif sehingga diberikan cara dengan uji statistik yang bersifat objektif
dalam memberikan kesimpulan. Uji statistik ini disebut uji kenormalan.
Uji kenormalan menurut Arshad dkk. [4] ada empat kategori yaitu uji
commit to user
chi-kuadrat, teknik momen rasio, uji berdasarkan korelasi, dan uji berdasarkan
fungsi distribusi empiris. Dalam software statistika seperti Minitab, SPSS, dan R,
1
perpustakaan.uns.ac.id
digilib.uns.ac.id
beberapa uji kenormalan termasuk dalam kategori fungsi distribusi empiris. Uji
berdasarkan fungsi distribusi empiris melibatkan data empiris (data yang berasal
dari pengamatan).
Uji kenormalan pada kategori fungsi distribusi empiris menurut Stephens
[18] merupakan uji yang didasarkan pada perbandingan antara fungsi distribusi
empiris dan yang dihipotesiskan. Thode [24] menyatakan uji kenormalan pada kategori fungsi distribusi empiris ada empat macam yaitu uji KolmogorovSmirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling. Statistik uji dari uji
Kolmogorov-Smirnov dan Kuiper menggunakan jarak maksimum antara fungsi
distribusi empiris dan yang dihipotesiskan. Sementara itu, statistik uji Cramervon Mises dan Anderson-Darling menggunakan kuadrat selisih antara fungsi distribusi empiris dan yang dihipotesiskan dengan pembobotan uji masing-masing.
Dengan demikian, keempat uji tersebut memiliki perumusan statistik uji
yang berbeda. Perumusan statistik uji yang berbeda ini memungkinkan adanya
perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk dibandingkan. Pernyataan tersebut dikuatkan oleh Razali dan Wah [15] yang mengatakan bahwa antara uji kenormalan yang satu dengan yang lain menghasilkan
kesimpulan yang berbeda. Beberapa uji menolak hipotesis nol (H0 ) sedangkan uji
yang lain gagal menolak H0 dengan H0 adalah sampel acak berasal dari populasi
berdistribusi normal.
Conover [7] menyatakan bahwa uji-uji statistik dapat dibandingkan berdasarkan kekuatan uji masing-masing. Kekuatan uji merupakan besarnya probabilitas
menolak H0 ketika H0 salah. Selain berdasarkan kekuatan uji, beberapa uji statistik juga dapat dibandingkan dengan melihat kepekaan dari masing-masing uji
dalam menolak H0 ketika H0 salah. Untuk mengetahui kepekaan uji masingmasing dalam menolak H0 ketika H0 salah, dilakukan metode simulasi. Apabila
simulasi melibatkan bilangan acak yang berasal dari distribusi tertentu, maka
dapat digunakan simulasi Monte Carlo.
Stephens [18] pada tahun 1974 melakukan penelitian mengenai perbandingcommit to user
an uji kenormalan pada kategori fungsi distribusi empiris menggunakan metode
2
perpustakaan.uns.ac.id
digilib.uns.ac.id
simulasi Monte Carlo sebanyak 1.000 kali pengulangan dengan ukuran sampel
yaitu 10, 20, dan 30. Hasil perbandingan uji-uji tersebut disajikan dalam bentuk tabel persentase menolak H0 . Penelitian Stephens menyimpulkan bahwa uji
Cramer-von Mises dan Anderson-Darling sama kuat dalam menguji kenormalan
data.
Selanjutnya, dalam penelitian ini dilakukan pengembangan terhadap hasil
penelitian Stephens yaitu perbandingan uji kenormalan pada ketegori fungsi distribusi empiris menggunakan metode simulasi Monte Carlo dengan 10.000 kali
pengulangan dan ukuran sampel 10, 20,...,100. Hasil perbandingan keempat uji
tersebut disajikan dalam bentuk grafik persentase menolak H0 .
1.2
Perumusan Masalah
Berdasarkan latar belakang masalah, dapat dibuat perumusan masalah
yaitu
1. bagaimana perbandingan uji kenormalan pada ketegori fungsi distribusi
empiris untuk uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan
Anderson-Darling menggunakan metode simulasi Monte Carlo?
2. dari keempat uji tersebut, uji manakah yang paling peka menolak hipotesis
nol ketika hipotesis nol salah?
1.3
Batasan Masalah
Untuk mempermudah dalam pembahasan mengenai uji kenormalan pada
kategori fungsi distribusi empiris, penulis membatasi permasalahan yaitu tidak
ada nilai pengamatan yang sama dan dikhususkan untuk satu variabel (univariat).
1.4
Tujuan Penelitian
commit to user
Berdasarkan perumusan masalah, maka tujuan yang ingin dicapai dalam
penelitian ini adalah
3
perpustakaan.uns.ac.id
digilib.uns.ac.id
1. memperoleh perbandingan uji kenormalan pada ketegori fungsi distribusi
empiris untuk uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan
Anderson-Darling menggunakan metode simulasi Monte Carlo,
2. mendapatkan uji yang paling peka menolak hipotesis nol ketika hipotesis
nol salah dari keempat uji tersebut.
1.5
Manfaat Penelitian
Manfaat yang diharapkan dari penelitian ini yaitu apabila para statistikawan ingin mengetahui data berasal dari populasi yang berdistribusi normal, maka
dapat digunakan uji yang paling kuat dari keempat uji tersebut.
commit to user
4
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab II
LANDASAN TEORI
Pada bagian pertama bab ini diberikan tinjauan pustaka yang berisi kajiankajian yang pernah dilakukan dan digunakan sebagai dasar dilaksanakannya penelitian. Pada bagian kedua bab ini diberikan teori penunjang yang berisi definisidefinisi dan teorema sebagai dasar untuk memperoleh pembahasan selanjutnya.
Pada bagian ketiga dari bab ini disusun kerangka pemikiran yang menjelaskan
alur pemikiran penulisan skripsi.
2.1
Tinjauan Pustaka
Stephens [18] pada tahun 1974 melakukan perbandingan uji kenormalan pada kategori fungsi distribusi empiris. Hasil penelitian Stephens disajikan dalam
Tabel 2.1. Dalam Tabel 2.1, notasi KS merupakan uji kenormalan menggunakan uji Kolmogorov-Smirnov, Ku menggunakan uji Kuiper, CV menggunakan
uji Cramer-von Mises, dan AD adalah menggunakan uji Anderson-Darling. Dari
tabel tersebut tampak bahwa uji Cramer-von Mises dan Anderson-Darling merupakan pasangan terbaik dari uji kenormalan kategori fungsi distribusi empiris
yang berarti sama-sama peka dalam mendeteksi ketidaknormalan sedangkan uji
Kolmogorov-Smirnov adalah uji yang paling tidak peka.
Razali dan Wah [15] pada tahun 2011 melakukan perbandingan antara uji
Kolmogorov-Smirnov, Liliefors, Shapiro-Wilk, dan Anderson-Darling untuk mendapatkan uji yang paling peka menolak H0 ketika H0 salah. Perbandingan dari
uji tersebut menggunakan metode simulasi Monte Carlo terhadap sampel yang
dibangkitkan dari distribusi yang tidak normal. Hasil perbandingan menunjukcommit to user
kan uji Shapiro-Wilk adalah uji yang paling peka menolak H0 ketika H0 salah,
kemudian diikuti oleh uji Anderson-Darling, Lilliefors, dan Kolmogorov-Smirnov.
5
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 2.1. Persentase dari sampel yang dapat ditolak untuk masing-masing uji
kenormalan dengan ukuran sampel berbeda
Distribusi
n
KS
V
CV
AD
Probabilitas
Chi-kuadrat
Eksponensial
Uniform
Distribusi
n
KS
V
CV AD
10
45
53
56
59
Probabilitas
10
51
65
64
67
Lognormal
20
86
94
94
-
20
78
84
88
91
30
98
100
100
-
30
94
97
99
99
10
30
36
38
41
10
13
14
16
16
20
59
71
74
82
20
22
22
26
26
30
76
88
90
95
30
29
31
35
-
20
12
17
16
21
10
17
18
18
20
30
17
25
26
-
20
23
25
28
32
Laplace
t
Sebagaimana yang telah dinyatakan oleh Ahad dkk. [1] pada tahun 2011, kepekaan uji kenormalan seperti uji Kolmogorov-Smirnov, Anderson-Darling, Cramer-von Mises, dan Shapiro-Wilk dapat dievaluasi dalam berbagai distribusi tidak normal dan ukuran sampel yang berbeda. Hasil yang diperlihatkan dalam
penelitian Ahad dkk. dari uji yang paling peka menolak H0 ketika H0 salah secara berturut-turut adalah uji Shapiro-Wilk, Anderson-Darling, Cramer-von Mises,
dan Kolmogorov-Smirnov.
2.2
Teori-Teori Penunjang
Pada bagian ini dijelaskan definisi, teorema, dan teori yang mendukung
dalam mencapai tujuan penelitian.
2.2.1
Konsep Dasar Statistika
Berikut konsep dasar statistika yang berguna dalam menunjang materi
dalam pembahasan. Definisi 2.2.1,commit
2.2.2, 2.2.4,
to userdan 2.2.5 mengacu dari Bain dan
Engelhardt [5] sedangkan definisi 2.2.3 dari Conover [7].
6
perpustakaan.uns.ac.id
digilib.uns.ac.id
Definisi 2.2.1. Variabel acak X adalah suatu fungsi yang memetakan setiap hasil
e yang mungkin pada ruang sampel S dengan suatu bilangan real x, sedemikian
hingga X(e)=x.
Definisi 2.2.2. Sampel acak berukuran n dari variabel acak X adalah himpunan
variabel acak X1 , X2 , ..., Xn yang mempunyai fungsi densitas probabilitas f (x).
Definisi 2.2.3. Fungsi densitas probabilitas dari variabel acak X merupakan fungsi yang memberikan probabilitas X pada suatu nilai x (x suatu bilangan real), yang
dinyatakan sebagai
f (x) = P (X = x), x = x1 , x2 , ....
Fungsi densitas probabilitas untuk variabel acak kontinu lebih sering disebut
fungsi kepadatan.
Definisi 2.2.4. Fungsi distribusi kumulatif (CDF) dari variabel acak X untuk
setiap bilangan real x didefinisikan sebagai
F (x) = P (X ≤ x).
Definisi 2.2.5. Variabel acak X disebut variabel acak kontinu jika terdapat fungsi
f(x) yang merupakan fungsi kepadatan dari X maka fungsi distribusi kumulatifnya
dapat dinyatakan
∫
x
F (x) =
f (u)du.
−∞
2.2.2
Distribusi Probabilitas Kontinu Khusus
Menurut Supranto [23], distribusi probabilitas merupakan suatu gambaran bagaimana nilai-nilai probabilitas didistribusikan terhadap nilai-nilai variabel
acaknya. Apabila variabel acak X adalah kontinu, maka distribusi probabilitasnya disebut distribusi probabilitas kontinu. Berikut ini diberikan lima distribusi
probabilitas kontinu yang dipakai dalam simulasi. Teori-teori distribusi probabilitas berikut mengacu dari Bain dan
Engelhardt
commit
to user [5].
1. Distribusi Uniform
7
perpustakaan.uns.ac.id
digilib.uns.ac.id
Apabila variabel acak X kontinu yang mengasumsikan nilai hanya pada
suatu interval terbatas, yaitu interval (a, b), dengan fungsi kepadatan konstan, maka distribusinya disebut distribusi uniform. Variabel acak X yang
berdistribusi uniform memiliki fungsi kepadatan


f (x; a, b) =
1
b−a
 0
,a<x<b
, x yang lain
dan dapat dinotasikan dengan X ∼ U N IF (a, b).
2. Distribusi Gamma
Variabel acak X kontinu dikatakan mempunyai distribusi gamma dengan
parameter θ > 0 dan κ > 0 jika mempunyai bentuk fungsi kepadatan


f (x; θ, κ) =
1
xκ−1 e−x/θ
θ κ Γ(κ)
 0
,x>0
, x yang lain
dan dinotasikan sebagai X ∼ GAM (θ, κ).
3. Distribusi Eksponensial
Distribusi eksponensial diperoleh dari distribusi gamma dengan θ dan κ = 1
sehingga mempunyai bentuk fungsi kepadatan

 1 e−x/θ , x > 0
θ
f (x; θ) =
 0
, x yang lain
Variabel acak X yang berdistribusi eksponensial dengan parameter θ dapat
dinotasikan sebagai X ∼ EXP (θ).
4. Distribusi Chi-Kuadrat
Distribusi chi-kuadrat diperoleh dari distribusi gamma dengan θ = 2 dan
κ=
ν
2
sehingga mempunyai bentuk fungsi kepadatan
commit to user
8
perpustakaan.uns.ac.id
digilib.uns.ac.id


f (x; ν) =
ν
22
 0
−x
ν
1
x 2 −1 e 2
ν
Γ( 2 )
,x>0
, x yang lain.
Variabel acak X yang berdistribusi chi-kuadrat dengan derajat bebas ν
dapat dinotasikan sebagai X ∼ χ2 (ν).
5. Distribusi Beta
Variabel acak X kontinu dikatakan berdistribusi beta dengan parameter
a > 0 dan b > 0 jika mempunyai fungsi kepadatan


f (x; a, b) =
Γ(a+b) (a−1)
x
(1
Γ(a)Γ(b)
− x)(b−1) , 0 < x < 1
 0
, x yang lain
dan dapat dinotasikan sebagai X ∼ BET A(a, b).
Selain kelima distribusi tersebut, terdapat distribusi probabilitas kontinu
yang lain yaitu distribusi normal. Variabel acak X yang berdistribusi normal
dengan parameter µ dan σ 2 dapat dinotasikan sebagai X ∼ N (µ, σ 2 ). Menurut
Supranto [23], ciri-ciri dari distribusi normal adalah
1. bentuk kurva normal seperti lonceng dan simetris
2. parameter σ menunjukkan lebar dari kurva
3. titik tertinggi dari kurva normal terletak pada nilai rata-rata, median dan
modus yang sama
4. kedua ekor kurva memanjang tak terbatas dan tidak pernah memotong
sumbu horizontal
5. luas total area di bawah kurva normal sama dengan satu.
Fungsi kepadatan dari distribusi normal diberikan dalam rumus matematik
sebagai
commit to user
1 x−µ 2
1
f (x) = √
e− 2 ( σ ) , −∞ < x < ∞
2πσ 2
9
perpustakaan.uns.ac.id
digilib.uns.ac.id
dengan µ dan σ menunjukkan mean dan deviasi standar (Bain dan Engelhardt
[5]). Kurva dari fungsi kepadatan tersebut biasanya disebut kurva normal. Kurva
normal ditunjukkan pada Gambar 2.1. Gambar tersebut mengindikasikan bahwa
luas area di bawah kurva normal diantara nilai µ ± σ, µ ± 2σ, dan µ ± 3σ secara
berturut-turut sebesar 68, 26%, 95, 44%, dan 99,74%.
Gambar 2.1. Kurva normal
Menurut Soejoeti [16], fungsi distribusi kumulatif untuk distribusi normal
adalah
1
F (x) = P (X ≤ x) = √
2πσ 2
∫
x
1 u−µ 2
)
σ
e− 2 (
du.
−∞
Apabila variabel acak X berdistribusi normal dengan mean µ dan deviasi standar
σ, maka X dapat ditransformasikan menjadi variabel terstandarisasi
Z=
X −µ
σ
yang mempunyai distribusi normal standar (Johnson dan Bhattacharyya [11]).
Berikut ini diberikan teorema yang mengacu dari Strait [21].
Teorema 2.2.1. (Teorema Limit Pusat) Misalkan X1 , X2 , ..., Xn adalah variabel
acak yang independen dan berdistribusi identik dengan mean µ dan variansi σ 2 .
Misalkan variabel acak didefinisikan dengan X = (X1 +X2 +...+Xn )/n. Distribusi
dari
X −µ
√
σ/ n
commit to user
mendekati distribusi normal standar untuk n → ∞.
Zn =
10
perpustakaan.uns.ac.id
digilib.uns.ac.id
2.2.3
Fungsi Distribusi Empiris
Menurut Thode [24], fungsi distribusi empiris diperoleh dari sampel dan
disimbolkan dengan Fn (x). Definisi berikut mengacu dari Gibbons [10].
Definisi 2.2.6. Misalkan X1 , X2 , ..., Xn merupakan sampel acak berukuran n yang
diambil dari sebuah populasi dengan fungsi distribusi kumulatif F (x) bertipe kontinu dan X(1) < X(2) < ... < X(n) disusun dalam urutan naik dari Xi , maka
susunan inilah yang disebut statistik terurut dari sampel acak X1 , X2 , ..., Xn .
Misalkan X(1) , X(2) , ..., X(n) adalah statistik terurut, fungsi distribusi empiris didefinisikan sebagai



0,


Fn (x) =
x < X(1)
X(i) ≤ x < X(i+1)
i
n



 1,
X(n) ≤ x
dengan i = 1, 2, ..., n − 1.
2.2.4
Uji Hipotesis
Menurut Bain dan Engelhardt [5], uji hipotesis dilakukan untuk menentukan kebenaran atau kesalahan dari suatu hipotesis berdasarkan bukti pengamatan. Hipotesis ada dua macam yaitu hipotesis nol (H0 ) dan hipotesis alternatif
(H1 ). Berikut ini diberikan definisi yang berhubungan dengan uji hipotesis, yaitu
daerah kritis, statistik uji, tingkat signifikansi dan kekuatan uji. Definisi daerah
kritis, tingkat signifikansi, dan kekuatan uji mengacu dari Bain dan Engelhardt
[5] sedangkan definisi statistik uji dari Conover [7].
Definisi 2.2.7. Daerah kritis suatu uji merupakan himpunan nilai-nilai statistik
uji yang membawa ke penolakan hipotesis nol.
Definisi 2.2.8. Statistik uji adalah statistik yang digunakan untuk membantu
membuat kesimpulan dalam suatu uji hipotesis.
commit to user
Keputusan yang dibuat dalam menolak atau menerima hipotesis mengandung ketidakpastian. Ini artinya keputusan yang diperoleh bisa salah dan juga
11
perpustakaan.uns.ac.id
digilib.uns.ac.id
bisa benar. Adanya unsur ketidakpastian ini menyebabkan risiko bagi pembuat
keputusan. Besar kecilnya risiko dinyatakan dalam nilai probabilitas.
Tipe kesalahan yang mungkin terjadi dalam uji hipotesis ada dua macam.
1. Kesalahan tipe I
Kesalahan tipe I merupakan kesalahan menolak H0 padahal H0 benar. Probabilitas kesalahan tipe I dinotasikan sebagai α sehingga dapat dituliskan
P (Kesalahan tipe I)=α.
2. Kesalahan tipe II
Kesalahan tipe II adalah kesalahan gagal menolak H0 padahal H0 salah.
Probabilitas kesalahan tipe II dinotasikan β sehingga dapat dituliskan
P (Kesalahan tipe II)=β.
Definisi 2.2.9. Tingkat signifikansi dari uji hipotesis yang dinotasikan dengan
α adalah probabilitas maksimum menolak H0 padahal H0 benar.
Definisi 2.2.10. Kekuatan suatu uji merupakan besarnya probabilitas menolak
H0 ketika H0 salah dan dinotasikan sebagai
Kekuatan uji = 1-P (Kesalahan tipe II)=1-β.
2.2.5
Uji Kenormalan
Berikut hipotesis dari pengujian kenormalan suatu variabel acak X.
H0 :
Sampel acak berasal dari populasi dengan fungsi distribusi F (x), dimana
untuk kasus kenormalan F (x) berdistribusi normal.
H1 :
Sampel acak tidak berasal dari populasi berdistribusi normal.
commit µto dan
user σ 2 yang tidak diketahui. Oleh
Distribusi F (x) adalah normal dengan
karena itu, µ dan σ 2 diestimasi oleh x̄ =
12
∑n
i
n
xi
dan s2 =
∑n
i
(xi −x̄)2
.
n−1
Variabel X
perpustakaan.uns.ac.id
digilib.uns.ac.id
ditransformasikan menjadi variabel terstandarisasi Z. Karena µ dan σ 2 diestimasi
oleh x̄ dan s2 , maka variabel terstandarisasi Z dapat dihitung dengan rumus
zi = (xi − x̄)/s dan F (zi ) diperoleh dari tabel normal standar.
Menurut Thode [24], uji kenormalan pada kategori fungsi distribusi empiris didasarkan pada perbandingan antara fungsi distribusi empiris Fn (x) dan
yang dihipotesiskan F (x). Razali dan Wah [15] menyatakan uji kenormalan pada
kategori fungsi distribusi empiris dibagi menjadi 2 kelas.
1. Uji yang didasarkan pada jarak maksimum antara Fn (x) dan F (x), yang
termasuk dalam kelas ini adalah uji Kolmogorov-Smirnov dan Kuiper.
2. Uji Kuadratik.
Pada kelas ini didasarkan pada kuadrat selisih antara Fn (x) dan F (x). Uji
Anderson-Darling dan Cramer-von Mises termasuk dalam uji kuadratik.
Gambar 2.2 memberikan ilustrasi umum mengenai grafik fungsi distribusi
empiris Fn (x) dengan fungsi distribusi kumulatif normal F (x). Apabila Fn (x)
sangat berbeda dengan F (x), maka hipotesis nol akan ditolak. Ini berarti sampel
acak tidak berasal dari populasi yang berdistribusi normal.
Gambar 2.2. Fungsi distribusi empiris dan fungsi distribusi kumulatif normal
commit to user
13
perpustakaan.uns.ac.id
digilib.uns.ac.id
2.2.6
Uji Kolmogorov-Smirnov
Uji Kolmogorov-Smirnov digunakan untuk mengetahui apakah suatu sampel acak dari populasi kontinu yang tidak diketahui mengikuti suatu distribusi
tertentu. Statistik Kolmogorov-Smirnov D didefinisikan sebagai
D = max(D+ , D− )
dimana
D+ = maxi=1,2,...,n [ ni − F (zi )]
D− = maxi=1,2,...,n [F (zi ) −
i−1
].
n
Selanjutnya, Stephens [18] mendefinisikan modifikasi statistik KolmogorovSmirnov D∗ sebagai
√
0, 85
D∗ = ( n − 0, 01 + √ )D.
n
Pengambilan keputusan dari uji Kolmogorov-Smirnov dapat dilihat dari daerah
kritisnya. Daerah kritis untuk uji ini yaitu jika nilai modifikasi KolmogorovSmirnov D∗ lebih besar dari nilai kritisnya, maka H0 akan ditolak. Beberapa nilai
kritis untuk modifikasi Kolmogorov-Smirnov D∗ dengan masing-masing tingkat
signifikansi α (Thode [24]) dapat dilihat pada Tabel 2.2.
Tabel 2.2. Nilai kritis D∗
α
Nilai Kritis
10%
0,819
5%
0,895
2,5%
0,955
1%
1,035
2.2.7
Uji Kuiper
Kuiper [13] pada tahun 1960 mengusulkan suatu uji kenormalan pada katecommit to user
gori fungsi distribusi empiris dengan mengkombinasikan statistik KolmogorovSmirnov, yaitu D+ dan D− . Uji kenormalan ini dikenal sebagai uji Kuiper.
14
perpustakaan.uns.ac.id
digilib.uns.ac.id
Statistik Kuiper V didefinisikan sebagai
V = D+ + D−
dan modifikasi statistik Kuiper V ∗ untuk semua ukuran sampel (Stephens [18])
dinyatakan dengan
√
0, 82
V ∗ = ( n + 0, 05 + √ )V.
n
Selanjutnya, dalam mengambil keputusan pada pengujian hipotesis kenormalan data dengan uji ini diberikan suatu daerah kritis yaitu jika nilai modifikasi
statistik Kuiper V ∗ lebih besar dari nilai kritisnya, maka H0 akan ditolak. Besarnya nilai kritis untuk modifikasi statistik Kuiper V ∗ tampak dalam Tabel 2.3
dengan masing-masing tingkat signifikansi α (Thode [24]).
Tabel 2.3. Nilai kritis V ∗
2.2.8
α
Nilai Kritis
10%
1,386
5%
1,489
2,5%
1,585
1%
1,693
Uji Cramer-von Mises
Conover [7] menyatakan bahwa uji Cramer-von Mises dikembangkan oleh
Cramer dan von Mises. Uji Cramer-von Mises termasuk dalam uji kuadratik. Uji
kudratik didefinisikan oleh Anderson dan Darling [2] sebagai
∫ ∞
n
[Fn (x) − F (x)]2 ψ(F (x))dF (x).
(2.1)
−∞
dengan ψ(F (x)) fungsi pembobot. Uji cramer-von mises mempunyai fungsi pembobot ψ(F (x)) = 1 sehingga menjadi
∫ ∞
commit to user
n
[Fn (x) − F (x)]2 dF (x).
−∞
15
perpustakaan.uns.ac.id
digilib.uns.ac.id
Sebagaimana yang telah dinyatakan oleh Anderson dan Darling [3], diberikan statistik Cramer-von Mises W 2 sebagai
∑
2i − 1 2
1
+
[F (zi ) −
].
12n i=1
2n
n
W2 =
∗
Modifikasi statistik Cramer-von Mises W 2 yang diusulkan oleh Stephens [18]
didefinisikan dengan
∗
W 2 = (1 +
0, 5
)W 2 .
n
Uji Cramer-von Mises memberikan daerah kritis dalam pengujian hipotesis yaitu dengan membandingkan nilai modifikasi statistik Cramer-von Mises W 2∗ dan
nilai kritisnya. Jika nilai modifikasi statistik Cramer-von Mises W 2∗ lebih besar
daripada nilai kritis, maka hipotesis nol ditolak. Tabel 2.4 memberikan nilai kritis untuk modifikasi statistik Cramer-von Mises W 2∗ pada masing-masing tingkat
signifikansi α (Stephens [18]).
∗
Tabel 2.4. Nilai kritis W 2
2.2.9
(α
Nilai Kritis
10%
0,104
5%
0,126
2,5%
0,148
1%
0,178
Uji Anderson-Darling
Uji Anderson-Darling merupakan suatu uji kenormalan yang termasuk
dalam kategori fungsi distribusi empiris. Menurut Razali dan Wah [15], uji
Anderson-Darling adalah modifikasi dari uji Cramer-von Mises sehingga juga
termasuk dalam kelas kuadratik. Anderson dan Darling [3] menyatakan bahwa
pembobot untuk uji ini adalah
commit to user
1
ψ(F (x)) =
.
F (x)[1 − F (x)]
16
(2.2)
perpustakaan.uns.ac.id
digilib.uns.ac.id
Oleh karena itu, dengan mensubstitusikan persamaan (2.2) ke (2.1) diperoleh
∫ ∞
[Fn (x) − F (x)]2
n
dF (x).
−∞ F (x)[1 − F (x)]
Dalam rangka mempermudah perhitungan, diberikan formula untuk statistik Anderson-Darling A2 (Stephens [19]) dengan
n
[ (
)
(
)]
1∑
A = −n −
(2i − 1) ln F (zi ) + ln 1 − F (zn+1−i ) .
n i=1
2
Selanjutnya Stephens [20] mendefinisikan modifikasi statistik Anderson-Darling
∗
A2 sebagai
∗
A2 = (1 +
0, 75 2, 25 2
+ 2 )A .
n
n
Daerah kritis untuk uji Anderson-Darling dalam menentukan H0 ditolak
atau diterima dengan membandingkan nilai modifikasi statistik Anderson-Darling
∗
∗
A2 dan nilai kritisnya. Apabila nilai modifikasi statistik Anderson-Darling A2
lebih besar dari nilai kritisnya, maka H0 akan ditolak. Tabel 2.5 menyajikan ni∗
lai kritis untuk modifikasi statistik Anderson-Darling A2 dengan masing-masing
tingkat signifikansi α (Thode [24]).
∗
Tabel 2.5. Nilai kritis A2
2.2.10
α
Nilai Kritis
10%
0,656
5%
0,787
2,5%
0,918
1%
1,092
Simulasi Monte Carlo
Simulasi menurut Banks [6] adalah tiruan dari proses dunia nyata atau
sistem. Simulasi menyangkut pembangkitan proses serta pengamatan dari procommit
to user
ses untuk menarik kesimpulan dari
sistem
yang diwakili. Menurut Efron [9],
simulasi dilakukan sebanyak 10.000 kali agar meyakinkan bahwa simulasi mampu
17
perpustakaan.uns.ac.id
digilib.uns.ac.id
menjelaskan gambaran yang sebenarnya. Steelee dan Chaseling [17] mengatakan bahwa probabilitas penolakan hipotesis nol apabila hipotesis nol salah untuk
masing-masing uji statistik dapat diestimasi dengan 10.000 sampel acak yang
disimulasi.
Salah satu metode yang berperan dalam simulasi adalah metode Monte Carlo. Menurut Kakiay [12], prinsip kerja dari metode Monte Carlo adalah membangkitkan bilangan-bilangan acak atau sampel dari suatu variabel acak yang telah
diketahui distribusinya. Oleh karena itu, apabila menghendaki model simulasi
yang mengikutsertakan bilangan acak dengan distribusi probabilitas yang diketahui dan ditentukan, maka menggunakan metode simulasi Monte Carlo. Simulasi
Monte Carlo dapat diaplikasikan untuk mengestimasi nilai kritis atau membandingkan kepekaan uji (Steelee dan Chaseling [17]).
2.3
Kerangka Pemikiran
Berdasarkan tinjauan pustaka, dapat disusun suatu kerangka pemikiran
yang mungkin dalam pembahasan penelitian ini. Dalam menguji kenormalan data, uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling
memiliki perbedaan dalam perhitungan statistik uji. Hal ini menyebabkan adanya perbedaan kesimpulan diantara keempat uji tersebut. Mengingat pentingnya
menguji kenormalan guna menentukan metode yang akan digunakan oleh statistikawan, maka diperlukan suatu uji yang kuat dalam mendeteksi kenormalan
data.
Penelitian ini membandingkan keempat uji tersebut berdasarkan kepekaannya untuk menolak H0 ketika H0 salah. Untuk memperoleh kepekaan uji masingmasing dalam menolak H0 ketika H0 salah, dilakukan simulasi sampel acak dari
distribusi yang tidak normal sebanyak 10.000 kali pengulangan. Karena penelitian ini menghendaki model simulasi yang melibatkan bilangan acak dari distribusi
tertentu, maka menggunakan metode simulasi Monte Carlo. Hasil simulasi tersecommit to user
but dapat menghasilkan uji yang paling kuat dalam menguji kenormalan data.
18
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab III
METODE PENELITIAN
Metode yang digunakan dalam penelitian ini adalah studi literatur, yaitu
dengan cara mempelajari materi karya-karya ilmiah pada jurnal maupun buku
referensi. Adapun langkah-langkah yang dilakukan dalam penelitian ini sebagai
berikut.
1. Mengidentifikasi pengujian kenormalan dengan uji Kolmogorov-Smirnov,
Kuiper, Cramer-von Mises, dan Anderson-Darling.
2. Memberikan contoh adanya perbedaan kesimpulan diantara uji KolmogorovSmirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.
3. Mengkonstruksi metode simulasi Monte Carlo dengan software Matlab 7.1.
(a) Membangkitkan bilangan acak yang berdistribusi eksponensial dengan
ukuran sampel sebesar 10 sebanyak 10.000 kali.
(b) Setiap data bangkitan pada langkah (a) dihitung statistik ujinya dari
keempat uji tersebut.
(c) Jika statistik uji masing-masing lebih besar daripada nilai kritisnya,
maka H0 ditolak.
(d) Menghitung jumlah H0 yang ditolak dari 10.000 pengulangan untuk
masing-masing uji.
(e) Menghitung persentase menolak H0 untuk masing-masing uji.
Persentase menolak H0 = jumlah
H0 yang ditolak
x100%
10000
user
sampaito(e)
untuk ukuran sampel yang berva(f) Mengulangi langkah (a)commit
riasi yaitu 20, 30,...,100.
19
perpustakaan.uns.ac.id
digilib.uns.ac.id
(g) Membuat grafik antara ukuran sampel yang bervariasi dan persentase
menolak H0 dari keempat uji tersebut.
(h) Mengulangi langkah (a) sampai (g) untuk distribusi gamma, chi-kuadrat,
beta, dan uniform.
4. Membandingkan uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan
Anderson-Darling berdasarkan hasil simulasi. Uji yang memiliki kepekaan
tertinggi dalam menolak H0 ketika H0 salah merupakan uji yang paling
kuat dalam menguji kenormalan data.
Diagram alir dalam mengkonstruksi program simulasi disajikan selengkapnya dalam Gambar 3.1.
commit to user
20
perpustakaan.uns.ac.id
digilib.uns.ac.id
Gambar 3.1. Diagram alir simulasi
commit to user
21
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab IV
PEMBAHASAN
Dalam bagian ini yang dilakukan pertama kali adalah mengidentifikasi
pengujian kenormalan menggunakan uji kenormalan berdasarkan kategori fungsi
distribusi empiris yaitu uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan
Anderson-Darling. Selanjutnya diberikan contoh ketika hasil kesimpulan berbeda
antara uji yang satu dengan yang lainnya. Untuk mengatasinya, dilakukan simulasi Monte Carlo guna memperoleh kepekaan uji masing-masing dalam menolak
H0 ketika H0 salah sehingga diperoleh uji yang kuat dalam menguji kenormalan
data.
4.1
Prosedur Pengujian
Pada bagian ini, diberikan langkah-langkah pengujian hipotesis untuk mengetahui sampel acak berasal dari populasi berdistribusi normal atau tidak.
1. Uji Kolmogorov Smirnov
Berikut langkah-langkah pengujian hipotesis untuk kenormalan data menggunakan uji Kolmogorov-Smirnov.
(a) Hipotesis
H0 :
sampel acak berasal dari populasi berdistribusi normal
H1 :
sampel acak tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α)
(c) Daerah kritis
to user
H0 ditolak jika D∗ > commit
nilai kritis,
dimana nilai kritis diperoleh dari
Tabel 2.2
22
perpustakaan.uns.ac.id
digilib.uns.ac.id
(d) Statistik uji
Statistik uji dari uji Kolmogorov-Smirnov menggunakan jarak
maksimum antara Fn (x) dan F (x), yaitu [Fn (x)-F (x)] dan [F (x)Fn (x)]. Untuk Fn (x)>F (x), perumusan statistik uji KolomogorovSmirnov adalah [Fn (x)-F (x)] dan dinotasikan dengan D− . Sebaliknya
untuk Fn (x)<F (x), statistik uji Kolomogorov-Smirnov dinotasikan dengan D− dan dirumuskan dengan [F (x)-Fn (x)]. Dari dua hal tersebut diambil nilai yang maksimum. Nilai ini merupakan statistik uji
dari uji Kolomogorov-Smirnov yang dinotasikan dengan D. Statistik
uji Kolomogorov-Smirnov D tersebut kemudian dimodifikasi oleh Stephens [18] dengan metode simulasi Monte Carlo. Berikut perumusan
statistik uji Kolomogorov-Smirnov yang dimodifikasi.
√
0, 85
D∗ = ( n − 0, 01 + √ )D
n
(4.1)
dengan
D+
= maxi=1,2,...,n [ ni − F (zi )]
D−
= maxi=1,2,...,n [F (zi ) −
D
i−1
]
n
= max(D+ , D− )
dimana D∗ adalah modifikasi statistik Kolmogorov-Smirnov, D adalah
statistik Kolmogorov-Smirnov, n adalah banyaknya sampel acak dan
F (zi ) adalah distribusi probabilitas kumulatif normal standar untuk
zi = (xi − x̄)/s yang diperoleh dari tabel normal standar dengan xi
merupakan statistik terurut.
(e) Kesimpulan
2. Uji Kuiper
Uji Kuiper mengkombinasikan statistik Kolmogorov-Smirnov, yaitu D+ dan
commit to user
D− . Berikut ini adalah uji hipotesis untuk kenormalan data menggunakan
uji Kuiper.
23
perpustakaan.uns.ac.id
digilib.uns.ac.id
(a) Hipotesis
H0 :
sampel acak berasal dari populasi berdistribusi normal
H1 :
sampel acak tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α)
(c) Daerah kritis
H0 ditolak jika V ∗ > nilai kritis, dimana nilai kritis diperoleh dari
Tabel 2.3
(d) Statistik uji
Statistik uji Kuiper merupakan kombinasi statistik KolmogorovSmirnov, yaitu D+ dan D− sehingga uji ini juga menggunakan jarak
maksimum antara Fn (x) dan F (x). Sama halnya uji KolmogorovSmirnov, statistik uji Kuiper juga dimodifikasi dan dinotasikan dengan
V ∗ . Berikut ini perumusan dari modifikasi statistik Kuiper V ∗ .
√
0, 82
V ∗ = ( n + 0, 05 + √ )V
n
(4.2)
dengan V = D+ + D− . Notasi V menunjukkan statistik Kuiper, V ∗
adalah modifikasi statistik Kuiper dan n adalah banyaknya sampel
acak
(e) Kesimpulan
3. Uji Cramer-von Mises
Langkah-langkah pengujian hipotesis untuk kenormalan data dengan uji
Cramer-von Mises sebagai berikut.
(a) hipotesis
H0 :
sampel acak berasal dari populasi berdistribusi normal
H1 :
sampel acak tidak berasal dari populasi berdistribusi normal
(b) tingkat signifikansi (α)
(c) daerah kritis
commit to user
∗
H0 ditolak jika W 2 > nilai kritis, dimana nilai kritis diperoleh dari
Tabel 2.4
24
perpustakaan.uns.ac.id
digilib.uns.ac.id
(d) statistik uji
Statistik uji Cramer-von Mises menggunakan kuadrat selisih antara Fn (x) dan F (x) dengan fungsi pembobot ψ(F (x)) = 1, yaitu
∫∞
n −∞ [Fn (x) − F (x)]2 dF (x). Sebagaimana yang telah dinyatakan oleh
Anderson dan Darling [?], didefinisikan statistik Cramer-von Mises
∑
1
+ ni=1 [F (zi ) −
agar mempermudah dalam perhitungan, yaitu 12n
2i−1 2
].
2n
Rumus
2i−1
2n
merupakan rata-rata dari
i
n
dan
i−1
.
n
Seperti uji-
uji yang sebelumnya, statistik Cramer-von Mises juga dimodifikasi.
Perumusan modifikasi statistik Cramer-von Mises adalah
∗
W 2 = (1 +
0, 5
)W 2
n
(4.3)
dengan
W2
=
1
12n
+
∑n
i=1 [F (zi )
−
2i−1 2
]
2n
∗
dimana W 2 adalah modifikasi statistik Cramer-von Mises, W 2 adalah statistik Cramer-von Mises, n adalah banyaknya sampel acak dan
F (zi ) adalah distribusi probabilitas kumulatif normal standar untuk
zi = (xi − x̄)/s yang diperoleh dari tabel normal standar dengan xi
merupakan statistik terurut.
(e) kesimpulan
4. Uji Anderson-Darling
Berikut ini adalah pengujian hipotesis untuk kenormalan data yang menggunakan uji Anderson-Darling.
(a) Hipotesis
H0 :
sampel acak berasal dari populasi berdistribusi normal
H1 :
sampel acak tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α)
(c) Daerah kritis
commit to user
∗
H0 ditolak jika A2 > nilai kritis, dimana nilai kritis diperoleh dari
Tabel 2.5
25
perpustakaan.uns.ac.id
digilib.uns.ac.id
(d) Statistik uji
Statistik uji Anderson-Darling didefinisikan dengan
∫ ∞
[Fn (x) − F (x)]2
dF (x)
n
−∞ F (x)[1 − F (x)]
dimana
1
F (x)[1−F (x)]
merupakan fungsi pembobot. Berdasarkan rumus-
an tersebut, dapat diketahui bahwa statistik uji Anderson-Darling juga
menggunakan kuadrat selisih antara Fn (x) dan F (x). Menurut Stephens [19], dalam rangka mempermudah perhitungan diberikan formu)
∑ [ (
la untuk statistik Anderson-Darling, yaitu −n − n1 ni=1 ln F (zi ) +
(
)]
ln 1 − F (zn+1−i ) . Formula 2i−1
dalam perumusan tersebut merun
i
n
pakan penambahan antara
dan
i−1
.
n
Stephens juga memodifikasi
statistik Anderson-Darling melalui simulasi Monte Carlo. Berikut modifikasi statistik Anderson-Darling.
∗
A2 = (1 +
0, 75 2, 25 2
+ 2 )A
n
n
(4.4)
dengan
A
2
= −n −
1
n
[ (
)
(
)]
i=1 (2i − 1) ln F (zi ) + ln 1 − F (zn+1−i )
∑n
∗
dimana A2 adalah modifikasi statistik Anderson-Darling, A2 adalah statistik Anderson-Darling, n adalah banyaknya sampel acak dan
F (zi ) adalah distribusi probabilitas kumulatif normal standar untuk
zi = (xi − x̄)/s yang diperoleh dari tabel normal standar dengan xi
merupakan statistik terurut.
(e) Kesimpulan
4.2
Perbedaan Kesimpulan
Di sini diberikan dua contoh adanya perbedaan kesimpulan diantara uji
Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.
commit to user
Contoh 4.2.1. Perbedaan kesimpulan antara uji Kolmogorov-Smirnov dengan
uji Kuiper, Cramer-von Mises, dan Anderson-Darling.
26
perpustakaan.uns.ac.id
digilib.uns.ac.id
Diberikan data X yang memuat sampel acak yang dibangkitkan dengan
n = 10. Data ditampilkan pada Tabel 4.1 dan diperoleh x̄ = −0, 59707 dan
s = 1, 13316.
Tabel 4.1. Data bangkitan pertama
-0,84864 0,23104
1,46901
-0,80387 -1,09376
-0,86493 0,99714
-1,46741
-1,72315 -1,86610
Langkah awal dalam pengujian kenormalan untuk keempat uji tersebut adalah mengurutkan data dari kecil ke besar. Data terurut tersebut selengkapnya
tampak dalam Tabel 4.2.
Tabel 4.2. Data terurut
-1,86610 -1,72315
-1,46741
-1,09376
-0,86493
-0,84864 -0,80387
0,23104
0,99714
1,46901
Berikut ini dilakukan pengujian kenormalan terhadap data Tabel 4.2 untuk
masing-masing uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises dan AndersonDarling dengan tingkat signifikansi 5%.
1. Menggunakan Uji Kolmogorov-Smirnov
(a) Hipotesis
H0 :
data berasal dari populasi berdistribusi normal
H1 :
data tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α) = 5%
(c) Daerah kritis
H0 ditolak jika D∗ > 0,895
(d) Statistik uji
Statistik uji ini, yaitu D∗ , ditentukan dengan (4.1). Agar lebih mudah,
ditentukan dahulu nilai D+ dan D− . Perhitungan kedua nilai tersebut
commit to user
terlihat dalam Tabel 4.3. Dari Tabel 4.3, khususnya kolom 7 dan 8 diperoleh D+ = max[ ni −F (zi )] = 0, 27241 dan D− = max[F (zi )− i−1
]=
n
27
perpustakaan.uns.ac.id
digilib.uns.ac.id
0, 13138. Berdasarkan nilai D+ dan D− , diperoleh nilai yang maksimum dari keduanya sebesar 0,27241 sehingga D = 0, 27241. Dengan
demikian, D∗ = 0, 93193.
Tabel 4.3. Perhitungan D∗
i
xi
i
n
i−1
n
zi = (xi − x̄)/s
F (zi )
1
-1,86610
1
10
0
-1,11990
0,13138
-0,03138
0,13138
2
-1,72315
2
10
1
10
-0,99375
0,16017
0,03983
0,06017
3
-1,46741
3
10
2
10
-0,76806
0,22123
0,07877
0,02123
4
-1,09376
4
10
3
10
-0,43832
0,33058
0,06942
0,03058
5
-0,86493
5
10
4
10
-0,23638
0,40657
0,09343
0,00657
6
-0,84864
6
10
5
10
-0,22201
0,41215
0,18785
-0,08785
7
-0,80387
7
10
6
10
-0,18250
0,42759
0,27241
-0,17241
8
0,23104
8
10
7
10
0,73080
0,76755
0,03245
0,06755
9
0,99714
9
10
8
10
1,40687
0,92027
-0,02027
0,12027
10
1,46901
1
9
10
1,82329
0,96587
0,03413
0,06587
i
n
− F (zi ) F (zi ) −
i−1
n
(e) Kesimpulan
Karena D∗ = 0, 93193 >0,895 maka H0 ditolak. Ini berarti data yang
dibangkitkan dan yang disajikan dalam Tabel 4.2 tidak berasal dari
populasi yang berdistribusi normal.
2. Menggunakan Uji Kuiper
(a) Hipotesis
H0 :
data berasal dari populasi berdistribusi normal
H1 :
data tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α) = 5%
(c) Daerah kritis
commit to user
H0 ditolak jika V ∗ > 1,489
28
perpustakaan.uns.ac.id
digilib.uns.ac.id
(d) Statistik uji
Dari perhitungan sebelumnya, D+ = 0, 27241 dan D− = 0, 13138 sehingga nilai V = 0, 40379. Dengan (4.2), diperoleh V ∗ = 1, 40179.
(e) Kesimpulan
Karena V ∗ = 1, 40179 <1,489 maka H0 diterima. Artinya data hasil
bangkitan yang ditampilkan dalam Tabel 4.2 berasal dari populasi
yang berdistribusi normal.
3. Menggunakan Uji Cramer-von Mises
(a) Hipotesis
H0 :
data berasal dari populasi berdistribusi normal
H1 :
data tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α) = 5%
(c) Daerah kritis
∗
H0 ditolak jika W 2 > 0,126
(d) Statistik uji
∗
Statistik uji ini, yaitu W 2 , dirumuskan dalam persamaan (4.3). Dari (4.3), terlihat bahwa terlebih dahulu ditentukan nilai W 2 . Nilai
W 2 bergantung pada nilai [F (zi ) −
[F (zi ) −
2i−1 2
]
2n
2i−1 2
].
2n
Oleh karena itu, nilai
harus dihitung terlebih dahulu. Perhitungan nilai ter-
sebut tampak dalam Tabel 4.4. Dari Tabel 4.4, khususnya kolom 7
∑
2i−1 2
baris 12 dapat diperoleh 10
i=1 [F (zi ) − 2n ] = 0, 08379 sehingga nilai
∗
W 2 = 0, 09212. Dengan demikian, W 2 = 0, 09673.
(e) Kesimpulan
∗
Karena W 2 = 0, 09673 < 0,126 maka H0 diterima. Ini artinya data
yang disajikan dalam Tabel 4.2 dan merupakan data hasil bangkitan
berasal dari populasi yang berdistribusi normal.
commit to user
4. Menggunakan Uji Anderson Darling
29
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.4. Perhitungan W 2
∗
i
xi
zi = (xi − x̄)/s
1
-1,86610
-1,11990
0,13138 0,05
0,08138
0,00662
2
-1,72315
-0,99375
0,16017 0,15
0,01017
0,00010
3
-1,46741
-0,76806
0,22123 0,25
-0,02877
0,00083
4
-1,09376
-0,43832
0,33058 0,35
-0,01942
0,00038
5
-0,86493
-0,23638
0,40657 0,45
-0,04343
0,00189
6
-0,84864
-0,22201
0,41215 0,55
-0,13785
0,01900
7
-0,80387
-0,18250
0,42759 0,65
-0,22241
0,04947
8
0,23104
0,73080
0,76755 0,75
0,01755
0,00031
9
0,99714
1,40687
0,92027 0,85
0,07027
0,00494
10
1,46901
1,82329
0,96587 0,95
0,01587
∑10
i=1 [F (zi ) −
0,00025
F (zi )
2i−1
2n
F (zi ) −
2i−1
2n
[F (zi ) −
2i−1 2
]
2n
2i−1 2
]
2n
= 0,0837
(a) Hipotesis
H0 :
data berasal dari populasi berdistribusi normal
H1 :
data tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α) = 5%
(c) Daerah kritis
∗
H0 ditolak jika A2 > 0,787
(d) Statistik uji
∗
Statistik uji Anderson-Darling, yaitu A2 , dihitung dengan persamaan
∗
(4.4). Untuk memperoleh A2 , terlebih dahulu dihitung nilai A2 . Nilai
[ (
)
(
)]
2
A bergantung pada nilai (2i − 1) ln F (zi ) + ln 1 − F (zn+1−i ) .
Perhitungan nilai tersebut disajikan dalam Tabel 4.5. Dari tabel ini,
[ (
)
(
)]
∑10
= −105, 04973 sehingga
i=1 (2i − 1) ln F (zi ) + ln 1 − F (zn+1−i )
∗
A2 = 0, 50497. Berdasarkan nilai tersebut, dapat diperoleh A2 =
0, 55420.
commit to user
(e) Kesimpulan
30
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.5. Perhitungan A2
i
xi
zi =
∗
F (zi )
(
)
ln F (zi )
(
)
ln 1 − F (zn+1−i )
[ (
)
(2i − 1) ln F (zi ) +
(
)]
ln 1 − F (zn+1−i )
(xi − x̄)/s
1
-1,86610
-1,11990
0,13138
-2,02966
-3,37758
-5,40724
2
-1,72315
-0,99375
0,16017
-1,83151
-2,52910
-13,08183
3
-1,46741
-0,76806
0,22123
-1,50855
-1,45908
-14,83815
4
-1,09376
-0,43832
0,33058
-1,10691
-0,55790
-11,65367
5
-0,86493
-0,23638
0,40657
-0,90000
-0,53128
-12,88152
6
-0,84864
-0,22201
0,41215
-0,88637
-0,52184
-15,49031
7
-0,80387
-0,18250
0,42759
-0,84959
-0,40134
-16,26209
8
0,23104
0,73080
0,76755
-0,26455
-0,25004
-7,71885
9
0,99714
1,40687
0,92027
-0,08309
-0,17456
-4,38005
10
1,46901
1,82329
0,96587
∑10
-0,03473
-0,14085
-3,33602
[ (
)
(
)]
= -105,04973
i=1 (2i − 1) ln F (zi ) + ln 1 − F (zn+1−i )
∗
Karena A2 = 0, 55420 < 0,787 maka H0 diterima. Artinya data hasil
bangkitan yang terdapat dalam Tabel 4.2 berasal dari populasi yang
berdistribusi normal.
Sampai di sini, dengan uji Kolmogorov-Smirnov data yang dibangkitkan
ketika n = 10 merupakan data yang tidak berasal dari populasi berdistribusi
normal. Sebaliknya, jika dengan uji Kuiper, Cramer-von Mises, dan AndersonDarling maka data tersebut berasal dari populasi yang berdistribusi normal.
Contoh 4.2.2. Perbedaan kesimpulan antara uji Kolmogorov-Smirnov dan Kuiper dengan uji Cramer-von Mises dan Anderson-Darling.
Disini dibangkitkan lagi (kedua), data juga dengan n = 10. Data tersebut
selengkapnya tampak dalam Tabel 4.6.
Tabel 4.6. Data bangkitan kedua
-0,61924 -0,02983
0,08655
-0,34530 -0,13145
0,31483
-0,04687
0,54153
-1,79078
-0,2037
commit to user
Berikut ini dilakukan pengujian kenormalan terhadap data yang disajikan dalam Tabel 4.6 untuk masing-masing uji Kolmogorov-Smirnov, Kuiper’s,
31
perpustakaan.uns.ac.id
digilib.uns.ac.id
Cramer-von Mises, dan Anderson-Darling dengan tingkat signifikansi 5%.
1. Menggunakan Uji Kolmogorov-Smirnov
(a) Hipotesis
H0 :
data berasal dari populasi berdistribusi normal
H1 :
data tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α) = 5%
(c) Daerah kritis
H0 ditolak jika D∗ > 0,895
(d) Statistik uji
Berdasarkan perhitungan diperoleh D∗ = 0, 878968
(e) Kesimpulan
Karena D∗ = 0, 878968 <0,895 maka H0 diterima. Artinya data yang
dibangkitkan dan yang disajikan dalam Tabel 4.6 berasal dari populasi
yang berdistribusi normal.
2. Menggunakan Uji Kuiper
(a) Hipotesis
H0 :
data berasal dari populasi berdistribusi normal
H1 :
data tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α) = 5%
(c) Daerah kritis
H0 ditolak jika V ∗ > 1,489
(d) Statistik uji
Dari perhitungan diperoleh nilai V ∗ =1,38841
(e) Kesimpulan
Karena V ∗ = 1, 38841 <1,489 maka H0 diterima. Ini berarti data hasil
commit to user
bangkitan yang ditampilkan dalam Tabel 4.6 berasal dari populasi
yang berdistribusi normal.
32
perpustakaan.uns.ac.id
digilib.uns.ac.id
3. Menggunakan Uji Cramer-von Mises
(a) Hipotesis
H0 :
data berasal dari populasi berdistribusi normal
H1 :
data tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α) = 5%
(c) Daerah kritis
∗
H0 ditolak jika W 2 > 0,126
(d) Statistik uji
∗
Berdasarkan perhitungan diperoleh nilai W 2 =0,129361
(e) Kesimpulan
∗
Karena W 2 = 0, 129361 > 0,126 maka H0 ditolak. Hal ini berarti
data yang disajikan dalam Tabel 4.6 yang merupakan hasil bangkitan
tidak berasal dari populasi yang berdistribusi normal.
4. Menggunakan Uji Anderson Darling
(a) Hipotesis
H0 :
data berasal dari populasi berdistribusi normal
H1 :
data tidak berasal dari populasi berdistribusi normal
(b) Tingkat signifikansi (α) = 5%
(c) Daerah kritis
∗
H0 ditolak jika A2 > 0,787
(d) Statistik uji
∗
Dari perhitungan diperoleh A2 =0,843818
(e) Kesimpulan
∗
Karena A2 = 0, 843818 > 0,787 maka H0 ditolak. Ini berarti data
yang dibangkitkan dan yang
ditampilkan
commit
to user dalam Tabel 4.6 tidak berasal
dari populasi yang berdistribusi normal.
33
perpustakaan.uns.ac.id
digilib.uns.ac.id
Data yang dibangkitkan kedua ketika n = 10 menggunakan uji KolmogorovSmirnov dan Kuiper merupakan data yang berasal dari populasi berdistribusi
normal. Sedangkan, jika digunakan uji Cramer-von Mises dan Anderson-Darling
maka data tersebut tidak berasal dari populasi yang berdistribusi normal.
Dari dua contoh tersebut, yaitu pembangkitan data dengan n = 10 sebanyak
dua kali, tampak bahwa terdapat perbedaan kesimpulan diantara keempat uji
tersebut. Untuk mengatasinya, dilakukan simulasi sampel acak dari distribusi
yang tidak normal sebanyak 10.000 kali pengulangan guna memperoleh kepekaan
uji masing-masing untuk menolak H0 ketika H0 salah. Karena menghendaki
model simulasi yang melibatkan bilangan acak dari distribusi tertentu, maka
menggunakan metode simulasi Mote Carlo.
4.3
Simulasi Monte Carlo
Prinsip kerja dari simulasi Monte Carlo adalah membangkitkan bilangan
acak dari distribusi tertentu. Bilangan acak yang dibangkitkan tersebut dipandang sebagai sampel acak. Dalam kasus ini, sampel acak dibangkitkan dari berbagai distribusi yang tidak normal antara lain distribusi eksponensial, chi-kuadrat,
gamma, beta, dan uniform. Pembangkitan sampel acak dari masing-masing distribusi tersebut menggunakan ukuran sampel yang bervariasi yaitu 10, 20,...,100.
Setiap ukuran sampel dari distribusi tersebut diulang sebanyak 10.000 kali.
Selanjutnya, diambil tingkat signifikansi juga sebesar 5% dan dilakukan
pengujian kenormalan terhadap sampel acak tersebut untuk masing-masing uji
Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling. Dengan demikian, dapat diperoleh banyaknya H0 yang ditolak dari 10.000 pengulangan untuk keempat uji tersebut. Simulasi ini dilakukan dengan bantuan software Matlab 7.1.
commit to user
34
perpustakaan.uns.ac.id
4.3.1
digilib.uns.ac.id
Sampel Berdistribusi Eksponensial
Simulasi pertama menggunakan sampel acak dari distribusi eksponensial
dengan parameter θ = 7. Banyaknya H0 yang ditolak untuk masing-masing uji
kenormalan dengan ukuran sampel berbeda beserta persentasenya tampak dalam
Tabel 4.7.
Persentase menolak H0 dengan bervariasi ukuran sampel dalam Tabel 4.7
dapat juga disajikan sebagaimana tampak dalam Gambar 4.1. Hasil simulasi yang
terlihat dalam Gambar 4.1 menunjukkan bahwa semakin besar ukuran sampel,
persentase menolak H0 untuk keempat uji tersebut juga semakin besar.
Uji Anderson-Darling memiliki persentase menolak H0 yang lebih besar dari
uji Kuiper dan Cramer-von Mises. Namun, perbedaan persentase menolak H0
untuk ketiga uji tersebut tidak signifikan sehingga dianggap memiliki kepekaan
yang sama. Sedangkan uji Kolmogorov-Smirnov memiliki persentase menolak H0
yang paling kecil diantara ketiga uji tersebut. Uji Kolmogorov-Smirnov memiliki
kepekaan yang sama dengan ketiga uji yang lain ketika n = 50 dan hasil tersebut
tetap sama untuk ukuran sampel yang semakin besar. Ini artinya jika ukuran
sampel semakin besar, maka keempat uji tersebut akan sama kuat dalam menguji
kenormalan sehingga dapat memberikan kesimpulan yang sama.
4.3.2
Sampel Berdistribusi Chi-Kuadrat
Simulasi kedua ini, sampel acak yang dibangkitkan berasal dari distribusi chi-kuadrat dengan derajat bebas ν = 3. Banyaknya H0 yang ditolak untuk
masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari simulasi yang telah dilakukan tampak dalam Tabel 4.8. Hasil persentase menolak H0 dengan bervariasi ukuran sampel dalam Tabel 4.8 dapat juga
disajikan dalam bentuk grafik persentase menolak H0 sebagaimana tampak pada Gambar 4.2. Pada Gambar 4.2 menunjukkan bahwa hasil simulasi kedua ini
hampir sama dengan hasil simulasi yang pertama. Gambar tersebut menunjukcommit to user
kan ketika sampel dibangkitkan dari distribusi chi-kuadrat dengan ukuran sampel
semakin besar, persentase menolak H0 untuk keempat uji tersebut juga semakin
35
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.7. Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi eksponensial
n
10
20
30
40
50
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
3097
30,97
Ku
3754
CV
n
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
9862
98,62
37,54
Ku
9980
99,80
3901
39,01
CV
9982
99,82
AD
3888
38,88
AD
9991
99,91
KS
5754
57,54
KS
9958
99,58
Ku
6933
69,33
Ku
9995
99,95
CV
7271
72,71
CV
9996
99,96
AD
7523
75,23
AD
10000
100
KS
7843
78,43
KS
9992
99,92
Ku
8822
88,22
Ku
10000
100
CV
8968
89,68
CV
10000
100
AD
9196
91,96
AD
10000
100
KS
9048
90,48
KS
9994
99,94
Ku
9665
96,65
Ku
10000
100
CV
9686
96,86
CV
10000
100
AD
9812
98,12
AD
10000
100
KS
9635
96,35
KS
10000
100
Ku
9908
99,08
Ku
10000
100
CV
9907
99,07
CV
10000
100
AD
9965
99,65
AD
10000
100
60
70
80
90
100
commit to user
36
perpustakaan.uns.ac.id
Gambar 4.1.
digilib.uns.ac.id
Persentase menolak H0 dari sampel berdistribusi eksponensial
dengan parameter θ = 7 untuk n = 10, 20, ..., 100
besar.
Persentase menolak H0 untuk uji Anderson-Darling lebih besar dibandingkan dengan uji Cramer-von Mises tetapi selisihnya tidak signifikan sehingga kedua
uji tersebut dikatakan memiliki kepekaan yang sama. Ini artinya uji Cramer-von
Mises dan Anderson-Darling sama kuat untuk menguji kenormalan dan dapat
menghasilkan kesimpulan yang sama pula. Sebaliknya, uji Kolmogorov-Smirnov
memiliki persentase menolak H0 yang paling kecil diantara keempat uji tersebut.
Uji Kuiper, Cramer-von Mises, dan Anderson-Darling memiliki kepekaan yang
sama pada saat ukuran sampel mendekati 60. Sedangkan, ketika ukuran sampel
mendekati 80, uji Kolmogorov-Smirnov dapat dikatakan mempunyai kepekaan
yang sama seperti ketiga uji yang lain karena perbedaan persentase menolak H0
untuk keempat uji tersebut tidak signifikan. Ini berarti antara uji Kolmogorovcommit to user
Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling mempunyai kekuatan
37
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.8. Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi chi-kuadrat
n
10
20
30
40
50
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
2069
20,69
Ku
2365
CV
n
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
8931
89,31
23,65
Ku
9514
95,14
2535
25,35
CV
9663
96,63
AD
2511
25,11
AD
9821
98,21
KS
4080
40,80
KS
9421
94,21
Ku
4797
47,97
Ku
9821
98,21
CV
5387
53,87
CV
9881
98,81
AD
5561
55,61
AD
9948
99,48
KS
5903
59,03
KS
9702
97,02
Ku
6773
67,73
Ku
9930
99,30
CV
7375
73,75
CV
9954
99,54
AD
7702
77,02
AD
9981
99,81
KS
7268
72,68
KS
9853
98,53
Ku
8196
81,96
Ku
9973
99,73
CV
8640
86,40
CV
9982
99,82
AD
8983
89,83
AD
9992
99,92
KS
8291
82,91
KS
9917
99,17
Ku
9026
90,26
Ku
9989
99,89
CV
9312
93,12
CV
9993
99,93
AD
9556
95,56
AD
9999
99,99
60
70
80
90
100
commit to user
38
perpustakaan.uns.ac.id
digilib.uns.ac.id
yang sama sehingga kesimpulan yang dihasilkan keempat uji tersebut akan sama.
Gambar 4.2.
Persentase menolak H0 dari sampel berdistribusi chi-kuadrat
dengan derajat bebas ν = 3 untuk n = 10, 20, ..., 100
4.3.3
Sampel Berdistribusi Gamma
Pada simulasi ketiga ini, sampel acak yang digunakan berasal dari distribusi
gamma dengan parameter θ = 3 dan κ = 5. Tabel 4.9 menyajikan banyaknya H0
yang ditolak untuk masing-masing uji kenormalan dengan ukuran sampel berbeda
beserta persentasenya. Hasil simulasi tersebut juga ditunjukkan dengan grafik
persentase menolak H0 yang tampak dalam Gambar 4.3. Pada gambar tersebut
tampak bahwa hasil simulasi ini memberikan gambaran yang berbeda dengan
hasil simulasi yang sebelumnya. Namun, hasil simulasi ini juga menunjukkan
bahwa jika ukuran sampelnya semakin besar maka persentase menolak H0 untuk
commit to user
keempat uji tersebut juga semakin besar.
Berdasarkan Gambar 4.3 tampak bahwa jika ukuran sampel sebesar n = 10,
39
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.9. Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi gamma
n
10
20
30
40
50
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
1292
12,92
Ku
1335
CV
n
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
5868
58,68
13,35
Ku
6093
60,93
1485
14,85
CV
7310
73,10
AD
1411
14,11
AD
7787
77,87
KS
2289
22,89
KS
6795
67,95
Ku
2314
23,14
Ku
7008
70,08
CV
2943
29,43
CV
8181
81,81
AD
2993
29,93
AD
8584
85,84
KS
3259
32,59
KS
7284
72,84
Ku
3260
32,60
Ku
7567
75,67
CV
4222
42,22
CV
8602
86,02
AD
4440
44,40
AD
8990
89,90
KS
4241
42,41
KS
7854
78,54
Ku
4335
43,35
Ku
8220
82,20
CV
5497
54,97
CV
9040
90,40
AD
5854
58,54
AD
9357
93,57
KS
5182
51,82
KS
8274
82,74
Ku
5235
52,35
Ku
8587
85,87
CV
6543
65,43
CV
9323
93,23
AD
6954
69,54
AD
9574
95,74
60
70
80
90
100
commit to user
40
perpustakaan.uns.ac.id
Gambar 4.3.
digilib.uns.ac.id
Persentase menolak H0 dari sampel berdistribusi gamma
dengan parameter θ = 3 dan κ = 5 untuk n = 10, 20, ..., 100
kepekaan uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan AndersonDarling dalam menolak H0 ketika H0 salah adalah sama. Ini artinya keempat uji
tersebut dapat menghasilkan kesimpulan yang sama dalam menguji kenormalan
data. Namun, ketika ukuran sampel semakin besar, uji Kolmogorov-Smirnov dan
Kuiper memiliki persentase menolak H0 yang hampir sama dan lebih kecil dari uji
Cramer-von Mises dan Anderson-Darling. Hal ini menunjukkan uji KolmogorovSmirnov dan Kuiper memiliki kepekaan yang sama untuk menolak H0 ketika
H0 salah. Sebaliknya, uji Cramer-von Mises dan Anderson-Darling mempunyai
selisih persentase menolak H0 yang tidak signifikan sehingga kedua uji tersebut
dianggap memiliki kepekaan yang sama. Hal ini berarti apabila sampel berasal
dari distribusi gamma, baik uji Cramer-von Mises maupun uji Anderson-Darling
akan sama kuat dalam menguji kenormalan sehingga keduanya dapat memberikan
commit to user
kesimpulan yang sama.
41
perpustakaan.uns.ac.id
4.3.4
digilib.uns.ac.id
Sampel Berdistribusi Beta
Banyaknya H0 ditolak yang dihasilkan dari simulasi sampel acak berdistribusi beta dengan parameter a = 3 dan b = 1 untuk masing-masing uji kenormalan
dengan ukuran sampel berbeda beserta persentasenya tampak pada Tabel 4.10.
Hasil simulasi dalam tabel tersebut juga disajikan dalam bentuk grafik sebagaimana tampak dalam Gambar 4.4. Dari Gambar 4.4 secara keseluruhan, uji
Anderson-Darling memiliki persentase menolak H0 paling besar daripada ketiga
uji yang lain. Namun, pada saat ukuran sampel diambil kecil, dalam hal ini
n = 10, keempat uji tersebut mempunyai kepekaan yang sama untuk menolak
H0 ketika H0 salah. Tetapi, apabila diambil ukuran sampel besar, yaitu n = 40,
maka uji Anderson Darling adalah uji yang paling peka menolak H0 ketika H0
salah. Pada saat ukuran sampel sebesar 70, uji Anderson-Darling, Cramer-von
Mises, dan Kuiper memiliki persentase menolak H0 yang hampir sama dan selisihnya tidak signifikan sehingga ketiga uji tersebut dikatakan memiliki kepekaan
yang sama dalam menolak H0 ketika H0 salah. Ketika ukuran sampel semakin
besar, yaitu n = 100, tampak bahwa uji Kolmogorov-Smirnov, Kuiper, Cramervon Mises, dan Anderson-Darling memiliki kepekaan yang sama untuk menolak
H0 ketika H0 salah sehingga sama kuat dalam menguji kenormalan dan dapat
menghasilkan kesimpulan yang sama pula.
4.3.5
Sampel Berdistribusi Uniform
Simulasi kelima ini, sampel acak berasal dari distribusi uniform dengan
interval a = −3 dan b =3. Banyaknya H0 yang ditolak dari hasil simulasi kelima
ini dengan bervariasi ukuran sampel dan persentasenya tampak dalam Tabel 4.7.
Persentase menolak H0 dengan bervariasi ukuran sampel yang tampak dalam Tabel 4.7 untuk masing-masing uji juga disajikan dalam Gambar 4.5. Dari gambar
tersebut, ketika ukuran sampel diambil kecil, dalam hal ini n = 10 tampak bahwa uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling
commit to user
dapat memberikan kesimpulan yang sama. Hal ini karena keempat uji tersebut
memiliki perbedaan persentase menolak H0 yang tidak signifikan. Namun ke42
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.10. Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi beta
n
10
20
30
40
50
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
1436
14,36
Ku
1697
CV
n
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
7400
74,00
16,97
Ku
8741
87,41
1734
17,34
CV
8885
88,85
AD
1656
16,56
AD
9314
93,14
KS
2709
27,09
KS
8243
82,43
Ku
3223
32,23
Ku
9343
93,43
CV
3634
36,34
CV
9400
94,00
AD
3720
37,20
AD
9711
97,11
KS
3991
39,91
KS
8857
88,57
Ku
4934
49,34
Ku
9660
96,60
CV
5442
54,42
CV
9673
96,73
AD
5910
59,10
AD
9861
98,61
KS
5338
53,38
KS
9218
92,18
Ku
6561
65,61
Ku
9834
98,34
CV
6971
69,71
CV
9827
98,27
AD
7552
75,52
AD
9952
99,52
KS
6428
64,28
KS
9572
95,72
Ku
7842
78,42
Ku
9927
99,27
CV
8125
81,25
CV
9914
99,14
AD
8702
87,02
AD
9988
99,88
60
70
80
90
100
commit to user
43
perpustakaan.uns.ac.id
Gambar 4.4.
digilib.uns.ac.id
Persentase menolak H0 dari sampel berdistribusi beta
dengan parameter a = 3 dan b = 1 untuk n = 10, 20, ..., 100
commit to user
44
perpustakaan.uns.ac.id
digilib.uns.ac.id
tika n = 30, persentase menolak H0 untuk uji Kuiper, Cramer-von Mises, dan
Anderson-Darling memiliki selisih yang tidak signifikan dan lebih besar dari uji
Kolmogorov-Smirnov sehingga kepekaan ketiga uji tersebut dikatakan sama. Sebaliknya, uji Kolmogorov-Smirnov yang paling tidak peka menolak H0 ketika H0
salah.
Gambar 4.5.
Persentase menolak H0 dari sampel berdistribusi uniform
dengan parameter interval a = 3 dan b = −3 untuk
n = 10, 20, ..., 100
Pada saat ukuran sampel diambil besar, yaitu 100, terlihat bahwa uji Anderson-Darling memiliki persentase menolak H0 yang paling besar diantara keempat
uji tersebut sedangkan uji Kolmogrov-Smirnov tetap mempunyai persentase menolak H0 yang paling kecil. Selain itu, tampak bahwa uji Kuiper dan Cramer-von
Mises memiliki perbedaan persentase menolak H0 yang tidak signifikan sehingga
to user
kepekaan kedua uji tersebut sama.commit
Dengan
demikian, Gambar 4.5 menunjukkan
bahwa semakin besar sampel yang diambil, uji Anderson-Darling akan semakin
45
perpustakaan.uns.ac.id
digilib.uns.ac.id
Tabel 4.11. Banyaknya menolak H0 untuk masing-masing uji kenormalan dengan ukuran sampel berbeda beserta persentasenya dari sampel
berdistribusi uniform
n
10
20
30
40
50
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
603
6,03
Ku
819
CV
n
Uji
Banyaknya
Persentase
Kenormalan
Menolak H0
(%)
KS
3233
32,33
8,19
Ku
5028
50,28
674
6,74
CV
5372
53,72
AD
606
6,06
AD
6566
65,66
KS
993
9,93
KS
3894
38,94
Ku
1473
14,73
Ku
5878
58,78
CV
1402
14,02
CV
6328
63,28
AD
1445
14,45
AD
7590
75,90
KS
1406
14,06
KS
4569
45,69
Ku
2266
22,66
Ku
6681
66,81
CV
2252
22,52
CV
7193
71,93
AD
2557
25,57
AD
8380
83,80
KS
1944
19,44
KS
5280
52,80
Ku
3217
32,17
Ku
7319
73,19
CV
3346
33,46
CV
7847
78,47
AD
4004
40,04
AD
8944
89,44
KS
2588
25,88
KS
5854
58,54
Ku
4160
41,60
Ku
7932
79,32
CV
4352
43,52
CV
8345
83,45
AD
5305
53,05
AD
9294
92,94
60
70
80
90
100
commit to user
46
perpustakaan.uns.ac.id
digilib.uns.ac.id
peka untuk menolak H0 ketika H0 salah. Hasil simulasi yang terakhir ini memperlihatkan bahwa semakin besar ukuran sampel yang diambil, uji Anderson-Darling
akan semakin kuat dalam menguji kenormalan data dibandingkan uji Cramer-von
Mises.
Dari kelima simulasi yang telah dilakukan, diperoleh urutan kepekaan uji
kenormalan pada kategori fungsi distribusi empiris dari yang paling peka secara berturut-turut adalah uji Anderson-Darling, Cramer-von Mises, Kuiper, dan
Kolmogorov-Smirnov. Oleh karena itu, dapat disimpulkan bahwa uji AndersonDarling yang paling peka menolak H0 ketika H0 salah. Ini artinya uji Andersondarling kuat dalam menguji kenormalan data. Sebaliknya, uji Kolmogorov-Smirnov
memiliki kepekaan terendah untuk menolak H0 ketika H0 salah sehingga uji ini
lemah dalam menguji kenormalan data.
commit to user
47
perpustakaan.uns.ac.id
digilib.uns.ac.id
Bab V
PENUTUP
5.1
Kesimpulan
Berdasarkan hasil simulasi Monte Carlo, urutan kepekaan dari yang tertinggi untuk uji kenormalan pada kategori fungsi distribusi empiris secara berturutturut adalah uji Anderson-Darling, Cramer-von Mises, Kuiper, dan KolmogorovSmirnov. Ini berarti uji Anderson-Darling paling peka dalam mendeteksi ketidaknormalan. Sebaliknya, uji Kolmogorov-Smirnov merupakan uji yang paling
lemah dalam menguji kenormalan data.
5.2
Saran
Skripsi ini hanya membahas mengenai perbandingan uji kenormalan pada
kategori fungsi distribusi empiris. Bagi pembaca yang tertarik, dapat membahas
mengenai perbandingan uji kenormalan pada kategori lainnya yaitu uji berdasarkan korelasi atau kategori teknik momen rasio.
commit to user
48
Download