Uploaded by User105147

Bab 3 Uji Kebaikan Suai (5)

advertisement
Buku Ajar Statistika Non Paramaterik
BAB 3.
UJI KEBAIKAN SUAI
3.1 PENDAHULUAN
3.1.1 Deskripsi Singkat
Dalam analisis statistika, sebuah prosedur analisis seringkali dikembangkan
dengan mengasumsikan input data merupakan suatu variabel acak yang berasal dari
suatu sebaran tertentu. Validitas dari prosedur analisis serta model-model yang
dikembangkan dengan metode analisis tersebut sangat tergantung dari apakah
input data yang akan digunakan sebagai dasar analisis/pemodelan tersebut
memang berasal dari sebaran seperti yang diasumsikan.
Oleh karena itu, sebelum
analisis tersebut dilakukan dan agar diperoleh suatu model atau hasil analisis yang
valid dan berguna, perlu diperiksa terlebih dahulu apakah sebaran data input
memang sesuai dengan sebaran sebagaimana yang diasumsikan.
Uji statistika yang digunakan untuk memeriksa kesesuaian antara sebaran
data input dengan sebaran data teoritis dinamakan uji kebaikan suai. Pada bab ini
akan dijelaskan mengenai dua uji kebaikan suai, yaitu uji khi kuadrat dan uji
Kolmogorov Smirnov.
3.1.2 Tujuan Pembelajaran
Pembelajaran pada bab ini bertujuan untuk memberikan pengetahuan
kepada mahasiswa mengenai
prosedur
pengujian kebaikan suai dengan
menggunakan uji khi kuadrat dan uji Kolmogorov smirnov untuk data satu sampel.
3.1.3 Manfaat dan Relevansi
Uji
kebaikan
suai
ini
berguna
pada
analisis
kuantitatif
untuk
mengembangkan model yang cukup menggambarkan fenomena empiris dan juga
sebagai untuk melakukan investigasi awal untuk membenarkan penggunaan
berbagai
teknik
analisis
statistik.
Dalam
pengembangan
model
yang
menggambarkan suatu fenomena, seringkali diasumsikan bahwa datanya menyebar
menurut suatu sebaran tertentu.
41
Buku Ajar Statistika Non Paramaterik
Sebagai contoh, pada pemodelan antrian. Antrian adalah suatu kejadian
yang sering ditemukan, seperti di bank saat nasabah mengantri di teller untuk
melakukan transaksi, di airport saat para calon penumpang melakukan check-in, di
super market saat para pembeli antri untuk melakukan pembayaran, dan masih
banyak contoh lainnya. Untuk mempertahankan pelanggan, sebuah organisasi selalu
berusaha untuk memberikan pelayanan yang cepat sehingga pelanggan tidak
dibiarkan menunggu (mengantri) terlalu lama. Namun ada konsekuensi biaya bagi
organisasi jika harus menambah fasilitas layanan. Oleh karena itu diperlukan suatu
pemodelan antrian untuk menemukan fasilitas pelayanan yang memadai bagi
perusahaan dalam merupakan suatu variabel melayani nasabahnya. Pada suatu
pemodelan antrian, biasanya diasumsikan bahwa data input Poisson.
Untuk
mengembangkan suatu model antrian yang valid dan berguna, (dalam hal ini dapat
berupa banyaknya kedatangan pada jalur antrian dalam suatu satuan waktu) maka
harus diperiksa terlebih dahulu apakah input data tersebut memang sesuai dengan
proses Poisson tersebut. Jika asumsi tersebut terlanggar, akan dapat ditemukan
kesalahan kesimpulan yang akan diambil dari hasil analisis tersebut. UJi kebaikan
suai adalah uji yang dapat digunakan untuk keperluan tersebut.
Uji kebaikan suai ini akan sangat bermanfaat terutama jika peneliti ingin
memeriksa teori mengenai sebaran atau jika peneliti memiliki dugaan yang kuat
mengenai bentuk sebaran populasi dan berharap dapat memperoleh dukungan
secara statistic bagi dugaannya tersebut dengan menerima hipotesis awal bahwa
data yang dimilikinya cocok sebaran tertentu.
Uji kebaikan suai yang akan dijelaskan pada bab ini dilakukan menggunakan
prosedur pengujian hipotesis yang dijelaskan pada Bab 1.
Oleh karena itu,
pemahaman mengenai materi pengujian hipotesis tersebut merupakan hal yang
sangat penting untuk dapat memahami materi yang dijelaskan di bab ini dengan
baik. Demikian juga dengan materi sebaran data yang merupakan hal yang diuji,
Materi uji kebaikan suai yang dijelaskan pada bab ini dilakukan untuk data
dengan satu variabel. Pengujian dengan cara yang hampir sama dapat dilakukan
untuk data dengan dua variabel, yang akan dijelaskan pada Bab 5.
3.1.4 Kompetensi
Setelah menyelesaikan materi ini, mahasiswa diharapkan mampu :
42
Buku Ajar Statistika Non Paramaterik
1. melakukan uji kebaikan suai dengan menggunakan Uji Khi Kuadrat satu sampel
serta mengambil kesimpulan mengenai sebaran data populasi
2. melakukan uji kebaikan suai dengan menggunakan Uji Kolmogorov Smirnov
satu sampel serta mengambil kesimpulan mengenai sebaran data populasi.
3.2 URAIAN MATERI
Uji kebaikan suai adalah uji statistika yang digunakan untuk memeriksa
kesesuaian sebaran suatu populasi dengan sebaran teoritis tertentu berdasarkan
data sampel yang diambil dari populasi tersebut. Hipotesis awal dari uji ini adalah
suatu pernyataan mengenai sebaran peluang yang dihipotesiskan sesuai dengan
data. Idealnya, sebaran yang dihipotesiskan tersebut dispesifikasi lengkap dengan
parameternya. Namun jika hipotesis hanya menyatakan bentuk sebarannya saja,
maka parameter sebaran harus diduga dulu dari data sebelum uji kebaikan suai
dilakukan. Di sisi lain, sebaran yang dinyatakan pada hipotesis alternative lebih
luas.
Dengan demikian, penolakan hipotesis awal tidak memberikan informasi
mengenai bentuk dari sebaran data, namun hanya menyimpulkan bahwa sebran
data bukanlah seperti yang dinyatakan pada hipotesis awal.
Pada bab ini, akan didiskusikan dua uji kebaikan suai, yaitu uji khi kuadrat
dan uji Kolmogorov Smirnov.
3.2.1 Uji Kebaikan Suai Khi Kuadrat
Untuk memahami uji kebaikan suai khi kuadrat ini, perhatikan ilustrasi berikut.
Contoh 3.2.1
Pada seuatu perguruan tinggi, besarnya biaya pendidikan yang dibebankan kepada
mahasiswa atau yang biasa dikenal dengan UKT (Uang Kuliah Tunggal) dibagi pada
5 level; level 1 hingga level 5. Perguruan tinggi tersebut menyatakan bahwa pada
tahun 2018, dari selurih mahasiswa aktif, persentase mahasiswa yang membayar
UKT pada setiap level tersebut berturut-turut adalah 15%, 25%, 35%, 15%, dan
10%. Untuk tahun 2019, akan diperiksa apakah sebaran UKT tersebut masih sama
seperti tahun sebelumnya. Untuk itu, dikumpulkan data UKT 500 orang mahasiswa
di tahun 2019 dan diperoleh banyaknya mahasiswa yang membayar UKT pada
43
Buku Ajar Statistika Non Paramaterik
setiap level berturut-turut 60, 115, 180, 90 dan 55.
Apakah data tersebut
mendukung pernyataan bahwa sebaran UKT tahun 2019 sama dengan sebaran UKT
tahun 2018?
Hipotesis yang akan diuji pada uji hipotesis ini adalah :
H0 :
Proporsi mahasiswa yang membayar UKT level 1 – level 5 adalah 15%,
25%, 35%, 15% dan 10%
H1 :
Proporsi mahasiswa yang membayar UKT level 1 – level 5 adalah selain
proporsi tersebut.
Sebaran sebagaimana yang dinyatakan pada hipotesis awal merupakan sebaran
teoritis yang akan diuji. Misalkan fi adalah banyaknya mahasiswa yang membayar
UKT level-I, sehingga :
𝑓1 = 60; 𝑓2 = 115; 𝑓3 = 180; 𝑓4 = 90; 𝑓5 = 55
Banyaknya pengamatan pada masing-masing kategori ini dinamakan frekuensi
amatan.
Jika hipotesis tersebut benar, maka diharapkan banyaknya mahasiswa yang
membayar UKT adalah :
Level 1 : 0,15 × 500 = 75
Level 2 : 0,25 × 500 = 125
Level 3 : 0,35 × 500 = 175
Level 4 : 0,15 × 500 = 75
Level 5 : 0,10 × 500 = 50
Banyaknya amatan yang diharapkan pada masing-masing kategori ini dinamakan
frekuensi amatan, dinotasikan dengan 𝑒𝑖 . Jadi,
𝑒1 = 75; 𝑒2 = 125; 𝑒3 = 175; 𝑒4 = 75; 𝑒5 = 50
Frekuensi teramati dan frekuensi harapan dari masing-masing kategori tersebut
adalah seperti pada tabel berikut.
Level
UKT
Level 1
Level 2
Level 3
Amatan (f)
60
115
180
Harapan
(e)
75
125
175
44
Buku Ajar Statistika Non Paramaterik
Level 4
Level 5
Total
90
55
500
75
50
500
Kesimpulan bahwa sebaran UKT 2018 dan 2019 sama akan dapat diperoleh
jika nilai kedua jenis frekuensi tersebut sama untuk semua kategori.
Dalam
prakteknya, sangat kecil peluangnya bahwa frekuensi amatan dan frekuensi
harapan akan bernilai persis sama.
Seperti yang terlihat pada tabel di atas,
sebahagian frekuensi harapan bernilai lebih dari frekuensi amatan sementara yang
lain bernilai kurang dari frekuensi harapan.
Pertanyaannya adalah apakah
perbedaan yang terjadi antara frekuensi amatan dan frekuensi harapan tersebut
cukup kecil untuk dapat dikatakan bahwa perbedaan tersebut terjadi secara
kebetulan saja (at chance).
Jika iya, maka sesungguhnya hal tersebut akan
mendukung pernyataan bahwa sebaran UKT di kedua tahun tersebut sama.
Dengan demikian, maka salah satu cara untuk memeriksa apakah sebaran
data sesuai dengan sebaran teoritisnya adalah dengan mendapatkan selisih antara
frekuesi teramati dan frekuensi harapan untuk setiap kategori. Pada dasarnya
selisih tersebut menyetakan ketidaksuaian antara kedua frekuensi. Namun,
ketidaksuaian secara keseluruhan tidak dapat ditentukan dengan hanya sekedar
menjumlahkan selisih yang didapat, dikarenakan total selisihnya pasti akan bernilai
0.
Alternatif lainnya adalah dengan mencari selisih kuadrat dari kedua jenis
frekuensi tersebut, (𝑓𝑖 − 𝑒𝑖 )2 .
Untuk menjadikannya unit asal skala yang akan
digunakan untuk mengukur kebaikan suai dari kedua distribusi, maka nilai selisih
kuadrat ini selanjutnya dibagi dengan frekuensi harapan, (𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖 . Nilai yang
terakhir inilah yang selanjutnya akan digunakan untuk mengukur kebaikan suai dari
kedua distribusi.
Untuk kasus di atas diperoleh :
Level
UKT
Level 1
Level 2
Level 3
Level 4
Level 5
Total
𝑓𝑖
60
115
180
90
55
𝑒𝑖
75
125
175
75
50
(𝑓𝑖 − 𝑒𝑖 )
-15
-10
5
15
5
0
(𝑓𝑖 − 𝑒𝑖 )2
225
100
25
225
25
(𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖
3
0,8
0,142857
3
0,5
7,442857
45
Buku Ajar Statistika Non Paramaterik
Ukuran ketidaksesuai, yang diukur dengan unit asal, diukur dengan menjumlahkan
nilai (𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖 untuk semua kategori sebagaimana [ada kolom terakhir tabel
tersebut. Jika H0 benar, maka sebaran penarikan sampel dari statistic ini akan
memiliki sebaran khi kuadrat dan oleh karenanya, uji ini dinamakan uji kebaikan
suai Khi Kuadrat.
Selanjutnya akan dijelaskan prosedur umum uji kebaiak suai khi kuadrat ini.
Data
Data yang digunakan untuk uji ini terdiri dari N pengamatan yang saling bebas. Data
dapat berupa :
a. data kategorik, dimana masing-masing pengamatan tersebut dapat
dimasukkan ke dalam salah satu dan hanya satu dari r kategori, π‘Ÿ ≥ 2,
b. data kualitatif yang kemudian dikelompokkan ke dalam r kategori yang tidak
saling tumpang tindih. Kategori ini dapat terbentuk secara alami (karena
sihat datanya) atau dibentuk secara sebarang oleh peneliti
Untuk menggunakan uji khi kuadrat ini, data harus berupa data cacahan yang
menunjukkan banyaknya objek pengamatan yang berada pada setiap kategori.
Frekuensi teramati dari masing-masing kategori tersebut dinotasikan dengan
𝑓1 , 𝑓2 , … , π‘“π‘Ÿ
Hipotesis
Hipotesis yang diuji pada uji Khi Kuadrat ini adalah :
H0 : Fungsi peluang dari variabel yang teramati adalah 𝑓𝑋 (π‘₯)
H1 : Fungsi peluang dari variabel yang teramati adalah selain 𝑓𝑋 (π‘₯)
Perhatikan bahwa hipotesis alternative tidak menyatakan secara spesifik sebaran
yang berbeda dari data jika H0 ditolak. Untuk data kategorik, jika 𝑝𝑖 adalah peluang
pengamatan berada pada katehori ke-I (i=1,2,…,r), maka total peluangnya harus
sama dengan 1. Hipotesis tersebut juga dapat dituliskan :
H0 : 𝑝𝑖 = 𝑝𝑖0 untuk semua i=1,2,…,r
H1 : 𝑝𝑖 ≠ 𝑝𝑖0 untuk beberapa i=1,2,…,r
46
Buku Ajar Statistika Non Paramaterik
Statistik Uji
Jika hipotesis awal ini benar, maka diharapkan bahwa pengamatan yang diharapkan
akan masuk ke kategori-i adalah
𝑒𝑖 = 𝑁𝑝𝑖0
dengan N adalah banyaknya pengamatan dan 𝑝𝑖0 adalah peluang pengamatan masuk
ke dalam kategori ke-i. Nilai peluang ini dinyatakan pada hipotesis awal. Nilai 𝑒𝑖
biasa dinamakan frekuensi harapan. Kadang-kadang nilai 𝑝𝑖0 ini tidak dinyatakan
secara spesifik pada hipotesis awal. Hipotesis awal hanya menspesifikasikan bentuk
sebarannya saja tanpa menyatakan nilai parameter sebaran yang diperlukan untuk
mendapatkan nilai 𝑝𝑖0 . Pada kasus tersebut, maka parameter populasi harus diduga
dari data sampel, untuk selanjutnya digunakan untuk mennduga nilai 𝑝𝑖0 .
Jika H0 benar, maka seharusnya terdapat kesesuaian yang baik antara
frekuensi yang teramati (𝑓𝑖 ) dan frekuensi harapan (𝑒𝑖 ) untuk seluruh kategori.
Keputusan mengenai kesesuaian ini didasarkan pada r selisih antara 𝑓𝑖 dan 𝑒𝑖 , 𝑓𝑖 −
𝑒𝑖 . Pada kenyataannya, total jumlah 𝑓𝑖 − 𝑒𝑖 untuk semua kategori sama dengan nol,
sehingga ∑π‘Ÿπ‘–=1(𝑓𝑖 − 𝑒𝑖 ) tidak dapat digunakan untuk mengukur ketidaksesuaian
antara kedua frekuensi tersebut.
Pengukuran ketidaksesuaian yang lebih baik
adalah dengan memberikan bobot yang sama untuk nilai positif dan negative dari
selisih tersebut.
Hal ini dapat dilakukan dengan mengkuadratkan nilai selisih
tersebut, selanjutnya, skalanya dapat dijadikan dalam unit asal dengan cara
membagi kuadrat tersebut dengan 𝑒𝑖 . Dengan demikian, kebaikan suai dari masingmasing kategori diukur dengan (𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖 .
Dan secara keseluruhan, ukuran
kebaikan suai antara data sampel dengan sebaran yang dihipotesiskan adalah :
π‘Ÿ
𝑄=∑
𝑖=1
(𝑓𝑖 − 𝑒𝑖 )2
𝑒𝑖
Inilah statistic uji yang digunakan pada uji kebaikan suai khi kuadrat ini. Nilai Q
yang kecil akan mendukung H0 sedangkan nilai Q yang besar menunjukkan
ketidaksesuaian antara frekuensi harapan dan teramati sehingga disimpulkan
bahwa data tidak tersebar menurut sebaran sebagaimana yang dinyatakan pada H0.
Sebagai tambahan, statistic uji khi kuadrat tersebut dapat dinyatakan dalam
bentuk
π‘Ÿ
𝑄=∑
𝑖=1
𝑓𝑖 2
𝑓1 2 𝑓2 2
π‘“π‘Ÿ 2
−𝑁 =
+
+ β‹―+
− 𝑁.
𝑒𝑖
𝑒1
𝑒2
π‘’π‘Ÿ
47
Buku Ajar Statistika Non Paramaterik
Namun demikian, formula ini tidak terlalu dianjurkan untuk digunakan, karena
tidak dapat diindikasikan kategori mana yang memberikan sumbangan yang besar
bagi ketidaksesuaian tersebut.
Titik Kritis
Sebaran penarikan sampel bagi nilai Q pada kedua formula di atas cukup
rumit. Namun, untuk sampel yang berukuran besar, statistic Q akan menyebar
menghampiri sebaran khi kuadrat dengan derajat bebas df=r-1 (df merupakan
singkatan dari degree of freedom atau derajat bebas). Keputusan untuk menolak
atau tidak menolak H0 dilakukan dengan membandingkan nilai Q yang diperoleh
dari data sampel dengan nilai pada sebaran khi kuadrat untuk derajat bebas r-1.
Dengan perbandingan ini, Ho akan ditolak jika
2
𝑄 > πœ’π‘Ÿ−1,𝛼
atau jika
𝑝 − π‘£π‘Žπ‘™π‘’π‘’ < 𝛼
dimana 𝛼 adalah taraf nyata pengujian yang digunakan. Tabel khi kuadrat dapat
dilihat pada Tabel B.
Langkah-langkah Pengujian Hipotesis
Dengan demikian, langkah-langkah pengujian hipotesis kebaikan suai khi
kuadrat adalah sebagai berikut.
1.
Nyatakan hipotesis
H0 : Fungsi peluang dari variabel yang teramati adalah 𝐹𝑋 (π‘₯)
H1 : Fungsi peluang dari variabel yang teramati adalah selain 𝐹𝑋 (π‘₯)
Hipotesisi ini dapat juga dinyatakan dalam
H0 : 𝑝𝑖 = 𝑝𝑖0 untuk semua i=1,2,…,r
H1 : 𝑝𝑖 ≠ 𝑝𝑖0 untuk beberapa i=1,2,…,r
2. Tentukan taraf nyata pengujian 𝛼
3. Tentukan statistic yang digunakan,yaitu :
π‘Ÿ
𝑄=∑
𝑖=1
(𝑓𝑖 − 𝑒𝑖 )2
𝑒𝑖
48
Buku Ajar Statistika Non Paramaterik
4. Berdasarkan 𝛼 tentukan :
-
titik kritis
2
: πœ’π‘Ÿ−1,𝛼
(r adalah jumlah kategori dan r-1 adalah derajat
bebas)
-
2
2
wilayah kritis : 𝑄 > πœ’π‘Ÿ−1,𝛼
atau wilayah penerimaan : 𝑄 ≤ πœ’π‘Ÿ−1,𝛼
Alternatif lain adalah dengan menentukan p-value berdasarkan nilai Q yang
diperoleh
5. Hitung nilai statistic uji khi kuadrat dengan cara :
a. (opsional) Duga parameter sebaran dari data
b. (opsional) Duga nilai 𝑝𝑖0
c. Tentukan frekuensi harapan
𝑒𝑖 = 𝑁𝑝𝑖0
d. Hitung selisih 𝑓𝑖 − 𝑒𝑖 untuk setiap kategori, kuadratkan selanjutnya bagi
dengan 𝑒𝑖 , sehingga diperoleh (𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖
e. Jumlahkan nilai (𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖 untuk setiap i, sehingga diperoleh nilai
π‘Ÿ
𝑄=∑
𝑖=1
(𝑓𝑖 − 𝑒𝑖 )2
𝑒𝑖
6. Kriteria penarikan kesimpulan
-
2
Tolak Ho jika 𝑄 > πœ’π‘Ÿ−1,𝛼
-
2
Tidak tolak H0 jika 𝑄 ≤ πœ’π‘Ÿ−1,𝛼
7. Interpretasi :
-
Tolak H0 : Pada taraf nyata 𝛼 disimpulkan bahwa data tidak menyebar
menurut sebaran yang dinyatakan pada H0
-
Tidak tolak H0 : Pada taraf nyata 𝛼 , tidak cukup bukti untuk menolak
bahwa data menyebar menurut sebaran yang dinyatakan pada H0.
Sebagai ilustrasi, perhatikan kembali Contoh 2.2.1 yang diilustrasikan sebelumnya.
Hipotesis yang diuji adalah:
H0 :
UKT 2019 menyebar dengan 𝑝1 = 0,15; 𝑝2 = 0,25; 𝑝3 = 0,35; 𝑝4 =
0,15; 𝑝5 = 0,10
H1 : UKT 2019 tidak menyebar dengan 𝑝1 = 0,15; 𝑝2 = 0,25; 𝑝3 = 0,35; 𝑝4 =
0,15; 𝑝5 = 0,10
49
Buku Ajar Statistika Non Paramaterik
Pada pengujian ini, digunakan taraf nyata pengujian sebesar 𝛼 = 5%.
Dengan
ukuran sampel N = 500, frekuensi harapan dari masing-masing kategori adalah :
𝑒1 = 𝑁𝑝10 = 0,15 × 500 = 75
𝑒2 = 𝑁𝑝20 = 0,25 × 500 = 125
𝑒3 = 𝑁𝑝30 = 0,35 × 500 = 175
𝑒4 = 𝑁𝑝40 = 0,15 × 500 = 75
𝑒5 = 𝑁𝑝50 = 0,10 × 500 = 50
Selanjutnya dihitung nilai statistic uji pada tabel berikut.
Level
UKT
Level 1
Level 2
Level 3
Level 4
Level 5
Total
𝑓𝑖
60
115
180
90
55
𝑒𝑖
75
125
175
75
50
(𝑓𝑖 − 𝑒𝑖 )
-15
-10
5
15
5
0
(𝑓𝑖 − 𝑒𝑖 )2
225
100
25
225
25
(𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖
3
0,8
0,142857
3
0,5
Q=7,442857
Jadi diperoleh nilai statistic hitung khi kuadrat adalah Q=7,442857. Dengan
banyak kategori r=5, derajat bebas df=r-1 = 4. Dan dengan taraf nyata 5%, diperoleh
2
nilai kritis πœ’4,0.05
= 9.49
df
:
4
:
…
…
…
…
Peluang ekor sebelah kanan
0.2
0.1
0.05
0.02
…
…
…
…
5.99
7.78
9.49
11.67
…
…
…
…
…
…
…
…
2
Karena nilai Q=7,44 < πœ’4,0.05
= 9.49 maka diputuskan untuk tidak tolak H0.
Alternatif lain untuk mengambil keputusan adalah dari nilai-p.
Sebelumnya
diperoleh nilai Q = 7,44. Dari tabel, diketahui bahwa untuk db = 4, nilai 7,44 adalah
untuk 0.1 < nilai p < 0.2. Dengan taraf nyata 𝛼 = 5% diketahui bahwa p-value > 𝛼
sehingga diputuskan untuk tidak tolak H0. Hal itu berarti bahwa pada taraf nyata
5%, tidak cukup bukti untuk menyangkal bahwa sebaran UKT mahasiswa di
pergurusan tinggi pada tahun tersebut adalah 𝑝1 = 0,15; 𝑝2 = 0,25; 𝑝3 = 0,35;
𝑝4 = 0,15; 𝑝5 = 0,10. Atau jika dikembalikan kembali ke permasalahan yang akan
diuji, dapat disimpulkan bahwa taraf nyata 5%, sebaran UKT mahasiswa di
pergurusan tinggi pada tahun 2019 tidak sama dengan sebaran UKT pada tahun
2018.
50
Buku Ajar Statistika Non Paramaterik
Sebagaimana telah dijelaskan sebelumnya, sebaran penarikan sample dari Q
menghampiri sebaran khi kuadrat. Jika N semakin besar, maka penghampiran ini
akan semakin baik. Hampiran ini cukup memuaskan jika untuk N yang besar,
katakanlah lebih dari 30. Suatu aturan umum adalah bawa penghampiran ini akan
cukup memuaskanjika tak lebih dari 20% ei bernilai kurang dari 5 dan tidak ada ei
yang bernilai kurang dari 1. Jika hal tersebut terjadi, maka langkah yang biasa
digunakan adalah dengan menggabungkan dua kategori yang berdekatan hingga
aturan tersebut terpenuhi.
Dengan adanya penggabungan tersebut, tentu saja
hipotesisnya harus diperbaharui.
Demikian juga, nilai derajat bebas juga akan
berkurang. Dan perlu diingat, penggabungan kategori tersebut akan berpengaruh
terhadap kesimpulan yang diambil dan interpretasinya.
Contoh 3.2.2
Seperti kasus sebelumnya, dan akan diuji apakah perbandingan persentase
mahasiswa yang membayar UKT level 1 – 5 adalah : 15%, 25%, 45%, 13% dan 2%.
Dari 100 orang yang diambil sebagai sampel, diketahui bahwa banyaknya
mahasiswa yang membayar UKT Level 1 – 5 berturut-turut 13, 27, 40, 15 dan 5
orang. Ujilah pada taraf nyata 5%
Solusi
Dari informasi tersebut, frekuensi harapan mahasiswa yang membayar UKT
level 5 adalah 2% x 100 = 2 mahasiswa yang kurang dari 5. Untuk itu dilakukan
penggabungan kategori kelompok UKT level 4 dan 5. Dengan demikian
perbandingan persentase mahasiswa pada keempat level UKT tersebut adalah 15%,
25%, 45% dan 15%, sehingga hipoetesis dinyatakan:
H0 :
UKT 2019 menyebar pada level 1, 2,3 dan 4-5 dengan 𝑝1 = 0,15; 𝑝2 =
0,25; 𝑝3 = 0,45; 𝑝4 = 0,15
H1 :
UKT 2019 tidak menyebar pada level 1, 2,3 dan 4-5 dengan 𝑝1 = 0,15;
𝑝2 = 0,25; 𝑝3 = 0,45; 𝑝4 = 0,15
Pengujian dilakukan dengan taraf nyata 5%. Nilai statistic uji diperoleh seperti pada
tabel berikut.
51
Buku Ajar Statistika Non Paramaterik
Level UKT
Level 1
Level 2
Level 3
Level 4 dan 5
Total
𝑓𝑖
13
27
40
20
𝑝𝑖
0,15
0,25
0,45
0,15
𝑓𝑖 2
169
729
1600
400
𝑒𝑖
15
25
45
15
𝑓𝑖 2 /𝑒𝑖
11,27
29,16
35,56
26,67
102,65
Diperoleh nilai statistic uji khi kuadrat
4
𝑄=∑
𝑖=1
𝑓𝑖 2
𝑓1 2 𝑓2 2 𝑓3 2 𝑓4 2
−𝑁 =
+
+
+
−𝑁
𝑒𝑖
𝑒1
𝑒2
𝑒3
𝑒4
= 102,65 − 100 = 2,65
Dari tabel khi kuadrat, untuk db = 4-1 =3 dan taraf nyata 5%, diperoleh
2
nilai πœ’3,0.05
= 7,82. Karena nilai Q=2,65 < 7,82, maka diputuskan untuk tidak tolak
H0. Dengan demikian, disimpulkan bahwa pada taraf nyata 5%, tidak cukup bukti
untuk menyangkal bahwa UKT 2019 menyebar pada level 1, 2,3 dan 4-5 dengan
𝑝1 = 0,15; 𝑝2 = 0,25; 𝑝3 = 0,45; 𝑝4 = 0,15.
Bila data yang akan digunakan sebagai dasar pengujian diskret, tentulah
tidak terlalu sulit untuk memasukkan data tersebut ke dalam masing-masing
kategori. Namun kadang-kadang, data yang tersedia merupakan hasil pengukuran
kuantitatif dan tidak dikategorikan.
Pada kondisi ini, untuk menggunakan uji
kebaikan suai khi kuadrat, maka peneliti harus terlebih dahulu mengelompokkan
data ke dalam r kategori berupa selang numeric. Dalam penentuan batas-batas
selang, disarankan untuk membentuk selang sedemikian sehingga frekuensi
harapan pada masing-masing kategori sama, yaitu 𝑒𝑖 =
𝑁
,𝑖
π‘Ÿ
= 1,2, … , π‘Ÿ.
Pada contoh berikut ini, sebaran yang dihipotesisikan pada uji kebaikan
suai adalah sebaran binomial.
Sebelumnya akan direview tersebuh dahulu
mengenai sebaran binomial.
Misalkan suatu percobaan hanya memiliki dua kemungkinan hasil, yakni
berhasil dan gagal. Percobaan tersebut dinamakan percobaan Bernoulli. Misalkan
dilakukan n ulangan percobaan Bernoulli yang saling bebas. Jika dinyatakan suatu
peubah acak sebagai banyaknya keberhasilan dalan n kali ulangan Bernoulli yang
saling bebas, maka peubah acak tersebut dinamakan peubah acak binomial dan
sebarannya dinamakan sebagai sebaran binomial.
Jika suatu peubah acak X
memiliki sebaran binomial, maka fungsi peluangnya adalah
52
Buku Ajar Statistika Non Paramaterik
𝑛
𝑓(π‘₯) = ( ) 𝑝 π‘₯ (1 − 𝑝)𝑛−π‘₯ π‘₯ = 0,1,2, … , 𝑛
π‘₯
dengan n adalah banyaknya ulangan Bernoulli yang dilakukan dan p adalah peluang
terjadinya keberhasilan.
Contoh 3.2.3
Empat buah koin dilemparkan sekaligus dan dicatat banyaknya sisi angka yang
muncul. Percobaan semacam itu dilakukan dalam 160 kali ulangan. Diperoleh hasil
sebagai berikut.
Banyaknya
angka
muncul
0
1
2
3
4
sisi Frekuensi
yang
16
48
55
33
8
Ujilah pada taraf nyata 5% apakah koin tersebut setimbang (p=1/2)
Solusi
Percobaan yang dilakukan adalah pelemparan 4 buah koin dan dicatat banyaknya
sisi angka yang muncul. Untuk suatu koin, hanya terdapat dua kemungkinan hasil
percobaan, yakni munculnya sisi angka atau gambar. Dengan definisi tersebut,
maka peubah banyaknya sisi angka yang muncul adalah merupakan peubah
binomial dengan banyaknya ulangan n=4. Menguji apakah koin tersebut setimbang
berarti menguji bahwa data yang dimiliki meyebar menurut sebaran binomial
dengan n = 4 dan p = 0,5. Dengan demikian, hipotesis yang akan diuji adalah :
H0 : Data menyebar menurut sebaran Binomial (4, 0.5) (Koin setimbang)
H1 : Data tidak menyebar menurut sebaran Binomial (4, 0.5) (Koin tidak
setimbang).
Bila peubah X menyebar menurut binomial(4,0,5) maka fungsi kepekatan
peluangnya adalah :
4
𝑓(π‘₯) = ( ) 0,5π‘₯ (1 − 0,5)4−π‘₯
π‘₯
4
= ( ) 0,54 π‘₯ = 0,1,2,3,4
π‘₯
53
Buku Ajar Statistika Non Paramaterik
Peluang munculnya 0, 1, 2, 3, dan 4 sisi angka berturut-turut adalah :
4
𝑝0 = 𝑓(0) = ( ) 0,54 = 0,0625
0
4
𝑝1 = 𝑓(1) = ( ) 0,54 = 0,25
1
4
𝑝2 = 𝑓(2) = ( ) 0,54 = 0,375
2
4
𝑝3 = 𝑓(3) = ( ) 0,54 = 0,25
3
4
𝑝4 = 𝑓(4) = ( ) 0,54 = 0,0625
4
Perhitungan nilai statistic uji khi kuadrat dilakukan dengan cara sebagai berikut.
Banyaknya sisi
𝑓𝑖
angka yang muncul
𝑝𝑖
0
16 0,0625
1
48
0,25
2
55
0,375
3
33
0,25
4
8 0,0625
Total
Diperoleh nilai statistic uji khi kuadrat
4
𝑄=∑
𝑖=0
𝑒𝑖
10
40
60
40
10
𝑓𝑖 2
256
2304
3025
1089
64
𝑓𝑖 2 /𝑒𝑖
25,6
57,6
50,41667
27,225
6,4
167.2417
𝑓𝑖 2
− 𝑁 = 167,2417 − 160 = 7,2417
𝑒𝑖
2
Dengan db=5-1=4 dan taraf nyata pengujian 5%, diperoleh nilai kritis πœ’4,0.05
=9,49.
2
Karena Q < πœ’4,0.05
= 9.49 maka diputuskan untuk tolak H0. Disimpulkan bahwa
bahwa pada taraf nyata 5%, data tidak menyebar menurut sebaran Binom(n,p).
Dengan kata lain, disimpulkan bahwa koin tersebut tidak setimbang.
Pada contoh 2.2.3, nilai 𝑝𝑖0 dapat langsung diperoleh dari fungsi kepekatan
peluang sebaran Binomial karena parameter sebaran dinyatakan lengkap pada
hipotesis awalnya. Jika parameter sebaran tidak diketahui, maka parameter sebaran
tersebut harus diduga terlebih dahulu berdasarkan data sampel.
Pada contoh berikut ini akan diilustrasikan prosedur pengujian
hipotesis Khi Kuadrat jika parameter sebaran harus diduga dari data contoh. Pada
contoh ini, akan diuji apakan data berasal dari sebaran Poisson. Sebelumnya akan
direview terlebih dahulu mengenai sebaran Poisson
54
Buku Ajar Statistika Non Paramaterik
Peubah acak Poisson adalah salah satu peubah acak diskret yang
menyatakan banyaknya kejadian dalam suatu selang waktu atau luas daerah
tertentu. Suatu peubah acak X yang menyebar menurut sebaran Poisson biasanya
dinyatakan dengan 𝑋~𝑃𝑂𝐼(πœ‡) dengan πœ‡ adalah parameter sebaran Poisson yang
menyatakan rata-rata banyaknya kejadian dalam selang waktu dan luas daerah
tersebut. Peubah ini memiliki fungsi kepekatan peluang
𝑓(π‘₯) =
𝑒 −πœ‡ πœ‡ π‘₯
π‘₯!
π‘₯ = 0,1, …
Penduga bagi parameter πœ‡ pada sebaran Poisson ini adalah
⏞
πœ‡=
∑ π‘₯𝑖
𝑁
Contoh 3.2.4
Seorang peneliti akan memodelkan hubungan antara banyaknya kasus malaria yang
terjadi di kecamatan-kecamatan di Pulau Sumatera dengan factor-faktor yang
diduga mempengaruhinya.
Pemodelan itu delakukannya dengan menggunakan
analisis regresi Poisson. Untuk dapat menggunakan analisis tersebut, ia harus
memastikan bahwa data banyaknya kasus malaria tersebut menyebar menurut
sebaran Poisson. Ia memiliki data banyaknya kasus malaria di 136 kecamatan yang
dipilih secara acak dari seluruh kecamatan di Pulau Sumatera. Diperoleh hasil
sebagai berikut
Banyak kasus malaria
0
1
2
3
≥4
Banyak
kecamatan
78
41
15
2
0
Ujilah pada taraf nyata 10% bahwa data banyaknya kasus malaria tersebut
menyebar Poisson
Solusi
Hipotesis yang diuji adalah :
H0 : Jumlah kasus malaria menyebar menurut sebaran Poisson
H1 : Jumlah kasus malaria tidak menyebar menurut sebaran Poisson
55
Buku Ajar Statistika Non Paramaterik
Hipotesis ini akan diuji menggunakan uji Khi Kuadrat pada
taraf nyata 10%.
Statistik uji yang digunakan adalah
π‘Ÿ
𝑄=∑
𝑖=1
(𝑓𝑖 − 𝑒𝑖 )2
.
𝑒𝑖
Untuk mendapatkan frekuensi yang diharapkan pada masing-masing
kategori, maka harus diduga terlebih dahulu nilai peluang untuk setiap nilai peubah
acak Poisson.
Nilai tersebut diperoleh dari fungsi kepekatan peluang peubah
Poisson tersebut. Namun, karena nilai parameter tidak dinyatakan pada hipotesis
seperti pada Contoh 2.2.3, maka parameter tersebut harus diduga terlebih dahulu.
Nilai dugaan parameter adalah :
⏞
πœ‡=
∑ π‘₯𝑖 ∑ 𝑓𝑖 π‘₯𝑖 78(0) + 41(1) + 15(2) + 2(3)
=
=
= 0.57
𝑁
𝑁
136
Dengan demikian diperoleh fungsi kepekatan peluang sebaran POI(0.57)
𝑒 −πœ‡ πœ‡ π‘₯ 𝑒 −0.57 0.57π‘₯
𝑓(π‘₯) =
=
π‘₯!
π‘₯!
untuk π‘₯ = 0,1, …
Selanjutnya diperoleh nilai peluang dari masing-masing nilai :
𝑝10
𝑒 −0.57 0.570
= 𝑃(𝑋 = 0) = 𝑓(0) =
= 0,5677
0!
𝑝20 = 𝑃(𝑋 = 1) = 𝑓(1) =
𝑒 −0.57 0.571
= 0,3214
0!
𝑝30 = 𝑃(𝑋 = 2) = 𝑓(2) =
𝑒 −0.57 0.571
= 0,0910
0!
𝑝40 = 𝑃(𝑋 = 3) = 𝑓(3) =
𝑒 −0.57 0.571
= 0,0024
0!
Sedangkan 𝑝50 = 𝑃(𝑋 ≥ 4) diperoleh dari
𝑝50 = 𝑃(𝑋 ≥ 4) = 1 − (𝑝10 + 𝑝20 + 𝑝30 +𝑝40 )
= 1 − (0,5677 + 0,3214 + 0,0910 + 0,0024)
= 1 - 0,9996 -0,0004
Perhitungan nilai frekuensi harapan adalah.
Banyaknya sisi
angka yang muncul
0
1
2
3
≥4
𝑓𝑖
78
41
15
2
0
𝑝𝑖0
0,5677
0,3214
0,0910
0,0024
0,0004
𝑒𝑖 = 136𝑝𝑖0
77,2072
43,7104
12,376
0,3264
0,0544
56
Buku Ajar Statistika Non Paramaterik
Perhatikan hasil yang diperoleh pada tabel tersebut. Terdapat dua kategori
dengan nilai ei <5 yaitu pada kategori ke 4 dan 5. Oleh karena itu, kedua katehori
tersebut digabung dengan kategori sebelumnya. Hasil penggabungan tersebut
adalah sebagai berikut.
x
0
1
≥2
Total
𝑓𝑖
𝑝𝑖0
𝑒𝑖
78 0,5677 77,2072 0,008141
41 0,3214 43,7104 0,168067
17 0,0938 12,7568 1,411384
π‘„β„Žπ‘–π‘‘
1,587592
Dengan taraf nyata 10%, maka nilai kritis pada pengujian ini adalah nilai
2
2
πœ’2,0.1
= 4,6. Karena π‘„β„Žπ‘–π‘‘ = 1,59 < πœ’2,0.1
= 4,6 maka diputuskan untuk tidak tolak
H0 yang berarti bahwa pada taraf nyata 10% tidak cukup bukti untuk menyangkal
bahwa data jumlah kasus malaria di kecamatan-kecamatan di Pulau Sumatera
menyebar menurut sebaran Poisson. Hasil tersebut dapat dijadikan dasar teorits
bagi si peneliti untuk menggunakan analisis regresi Poisson dalam pemodelan yang
dilakukannya.
Penduga parameter dari beberapa sebaran lain yang dipilih disajikan pada
tabel berikut.
Sebaran
Binomial
Parameter
𝑝
Geometrik(p)
𝑝
Binomial
Negatif(r,p)
𝑝
Poisson(πœ‡)
πœ‡
Normal(πœ‡, 𝜎 2 )
πœ‡
𝜎2
Eksponensial(πœ† )
πœ†
Penduga Parameter
∑ π‘₯𝑖
⏞
𝑝=
𝑛
𝑛
⏞
𝑝=
∑ π‘₯𝑖
π‘Ÿ
⏞
𝑝=
π‘Ÿ + ∑ π‘₯𝑖 /𝑛
∑ π‘₯𝑖
𝑁
∑ π‘₯𝑖
⏞
πœ‡=
𝑁
⏞
πœ‡=
2
∑ π‘₯𝑖2 − 𝑁π‘₯Μ… 2
𝑁−1
∑ π‘₯𝑖
⏞
πœ†=
𝑁
⏞ =
𝜎
57
Buku Ajar Statistika Non Paramaterik
3.2.2 Uji Kebaikan Suai Kolmogorov Smirnov
Uji Kolmogorov Smirnov adalah uji lain yang dapat digunakan untuk
menguji kesesuaian antara sebaran sample dengan sebaran teoritis tertentu. Uji ini
diperkenalkan pertama kali oleh A.N Kolmogorov dan NV Smirnov. Uji ini dilakukan
jika terdapat suatu sampel acak berukuran N yang minimal diukur dalam skala
selang, baik diskret maupun kontinu.
Data tidak perlu dikelompokkan seperti
halnya pada pengujian Khi Kuadrat, namun jika dikelompokkan, data tersebut harus
berupa selang numeric.
Seperti halnya uji Khi Kuadrat, uji ini dilakukan untuk menguji sebuah
pernyataan bahwa data menyebar menurut sebaran teoritis tertentu atau dapat
dinyatakan :
H0 : Data menyebar menurut sebaran teoritis tertentu
H1 : Data tidak menyebar menurut sebaran tersebut
Untuk lebih memahami prosedur uji Kolmogorov Smirnov ini, perhatikan
ilustrasi berikut. Misalkan terdapat 25 data berikut.
0,0441
0,0711
0,1349
0,1349
0,1702
0,1988
0,2063
0,2071
0,2760
0,3433
0,3466
0,3492
0,7080
0,7662
0,7808
0,3603
0,4368
0,4574
0,4798
0,5074
0,6398
0,8015
0,90112
0,9391
0,9571
Ingin diuji apakah data tersebut berasal dari sebaran Seragam Kontinu
UNIF(0,1). Untuk tujuan tersebut, maka hipotesis dapat dinyatakan sebagai :
H0 : Data menyebar menurut sebaran UNIF(0,1)
H1 : Data tidak menyebar menurut sebaran UNIF(0,1)
Berikut akan diuraikan dasar pemikiran dalam menentukan statistic uji
yang akan menjadi landasandalam mengambil keputusan unt uk menolak atau tidak
menolak H0.
Sebagaimana yang telah dijelaskan sebelumnya, bahwa uji Kolmogorv
Smirnov ini digunakan untuk menyelidiki kesesuaian dua fungsi sebaran yaitu
sebaran dari populasi dari mana data pengamatan tersebut diperoleh notasikan
dengan 𝐹(π‘₯), dengan sebaran teoritis tertentu yang dinyatakan pada hipotesis,
notasikan dengan, 𝐹0 (π‘₯). Fungsi sebaran populasi yang sesuangguhnya tidak akan
pernah diketahui kecuali jika semua nilai yang mungkin pada populasi tersebut
dimiliki. Untuk itu, sampel ditarik secara acak dari populasi tersebut. Jika sampel
tersebut mewakili populasi tersebut, maka fungsi sebaran kumulatif data, notasikan
dengan 𝑆(π‘₯) akan merupakan dicerminkan yang baik bagi 𝐹(π‘₯). Oleh karenanya,
58
Buku Ajar Statistika Non Paramaterik
pemeriksaan kesesuaian antara fungsi sebaran populasi 𝐹(π‘₯) dan fungsi sebaran
teoritis 𝐹0 (π‘₯) dapat dilakukan dengan menguji kesesuaian 𝑆(π‘₯) ini dengan 𝐹0 (π‘₯).
𝑆(π‘₯)dapat diperoleh dari proporsi data pengamatan yang bernilai kurang atau sama
dengan nilai x atau dapat dinyatakan sebagai :
𝑆(π‘₯) =
π‘π‘Žπ‘›π‘¦π‘Žπ‘˜π‘›π‘¦π‘Ž π‘π‘’π‘›π‘”π‘Žπ‘šπ‘Žπ‘‘π‘Žπ‘› π‘π‘’π‘Ÿπ‘›π‘–π‘™π‘Žπ‘– π‘˜π‘’π‘Ÿπ‘Žπ‘›π‘” π‘Žπ‘‘π‘Žπ‘’ π‘ π‘Žπ‘šπ‘Ž π‘‘π‘’π‘›π‘”π‘Žπ‘› π‘₯
𝑁
Perhatikan, untuk suatu nilai x < 0,0441, nilai S(x) = 0 karena tidak ada
pengamatan yang nilainya kurang dari x pada selang tersebut. Untuk 0,0441 ≤ π‘₯ <
0,0711, karena terdapat 1 data yang nilainya kurang dari x, maka 𝑆(π‘₯) =
1
25
= 0.04.
Untuk 0,0711 ≤ π‘₯ < 0,1349 terdapat 2 data yang nilainya kurang dari x yang berada
2
pada selang tersebut, sehingga 𝑆(π‘₯) = 25 = 0.08. Selanjutnya untuk 0,1349 ≤ π‘₯ <
0,1702 terdapat 4 data yang nilainya kurang dari x pada selang tersebut, sehingga
𝑆(π‘₯) =
4
25
= 0.16, demikian seterusnya. Diperoleh nilai S(x) pada setiap nilai riil x
seperti pada tabel berikut.
π‘₯𝑖
Selang nilai x
x < 0,0441
Frekuensi
Frek. kumulatif
𝑆(π‘₯𝑖 )
𝐹0 (π‘₯𝑖 )
0,0441
0,0441 < 0,0711
1
0,04
0,0441
0,0711
0,0711 ≤ x < 0,1349
2
0,08
0,0711
0,1349
0,1349 ≤ x < 0,1702
4
0,16
0,1349
0,1702
0,1702 ≤ x < 0,1988
5
0,20
0,1702
0,1988
0,1988 ≤ x < 0,2063
6
0,24
0,1988
0,2063
0,2063 ≤ x < 0,2071
7
0,28
0,2063
0,2071
0,2071 ≤ x < 0,2760
8
0,32
0,2071
0,2760
0,2760 ≤ x < 0,3433
0,3433
0,3433 ≤ x < 0,3466
0,3466
0,3466 ≤ x < 0,3492
0,3492
0,3492 ≤ x < 0,3603
0,3603
0,3603 ≤ x < 0,4368
0,4368
0,4368 ≤ x < 0,4574
0,4574
0,4574 ≤ x < 0,4798
0,4798
0,4798 ≤ x < 0,5074
0,5074
0,5074 ≤ x < 0,6398
0,6398
0,6398 ≤ x < 0,7080
0,7080
0,7080 ≤ x < 0,7662
0,7662
0,7662 ≤ x < 0,7808
0,7808
0,7808 ≤ x < 0,8015
0,8015
0,8015 ≤ x < 0,9011
0,9011
0,9011 ≤ x < 0,9391
0,9391
0,9391 ≤ x <0,9571
≥ 0,9391
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0,9571
9
0,36
0,2760
10
0,40
0,3433
11
0,44
0,3466
12
0,48
0,3492
13
0,52
0,3603
14
0,56
0,4368
15
0,60
0,4574
16
0,64
0,4798
17
0,68
0,5074
18
0,72
0,6398
19
0,76
0,7080
20
0,80
0,7662
21
0,84
0,7808
22
0,88
0,8015
23
0,92
0,9011
24
0,96
0,9391
25
1,00
0,9571
59
Buku Ajar Statistika Non Paramaterik
Sebaran data S(x) dapat digambarkan dengan menggunakan garis
berwarna biru pada Gambar 2.3.1.
Dari gambar tersebut dapat diketahui bahwa
S(x) merupakan kurva yang tidak turun dan kontinu dari arah kanan pada setiap
nilai-nilai pengamatan. S(x) juga digambarkan sebagai fungsi tangga yang nilainya
berubah pada setiap nilai yang berbeda dari x dengan loncatan sebesar proporsi
data pada nilai tersebut.
Pada contoh ini akan diuji apakah data memiliki sebaran UNIF(0,1).
Artinya, dalam pengujian ini akan diselidiki apakah sebaran S(x) sebagaimana yang
telah diperoleh sebelumnya sesuai dengan fungsi sebaran dari peubah UNIF(0,1).
Untuk peubah acak UNIF(0,1), fkp dan fungsi sebaran kumulatifnya masing-masing
adalah:
𝑓(π‘₯) = 1 π‘’π‘›π‘‘π‘’π‘˜ 0 < π‘₯ < 1
π‘₯
𝐹(π‘₯) = ∫ 1 𝑑𝑑 = 𝑑|0π‘₯ = π‘₯
π‘’π‘›π‘‘π‘’π‘˜ 0 < π‘₯ < 1
0
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,1
0,2
0,3
0,4
0,5
Keterangan : _____ : S(x)
0,6
0,7
0,8
0,9
1,0
_____ : F(x)
Gambar 2.3.1. Fungsi Sebaran Kumulatif Data (S(x)) dan Fungsi Sebaran Kumulatif
Teoritis (F0(x))
60
Buku Ajar Statistika Non Paramaterik
Dengan demikian, F(x) dapat digambarkan sebagai garis linier yang melalui titik asal
dengan gradient 1 sebagaimana yang diperlihatkan oleh garis berwarna merah pada
Gambar 2.3.1. Penentuan nilai 𝐹0 (π‘₯𝑖 ) pada setiap nilai pengamatan dapat dilihat
pada Tabel 2.3.1. Pada Gambar 2.3.1, kurva dari sebaran teoritis 𝐹0 (π‘₯) digambarkan
tumpang tindih dengan kurva sebaran data.
Jika 𝐹0 (π‘₯) ini adalah sebaran peluang kumulatif yang sebenarnya dari
populasi, maka seharusnya terdapat kesesuaian yang baik antara 𝑆(π‘₯) dan 𝐹0 (π‘₯)
tersebut untuk setiap nilai x. Hal ini ditunjukkan oleh kecilnya selisih mutlak antara
𝑆(π‘₯) dan 𝐹0 (π‘₯), untuk setiap nilai x di dalam selang (0,1) tersebut yang dinotasikan
dengan |𝑆(π‘₯𝑖 ) − 𝐹(π‘₯𝑖 )|.
Nilai |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯)| untuk setiap amatan yang berbeda
untuk ilustrasi ini dapat dilihat pada kolom ke-4 Table 2.3.2.
Tabel 2.3.2. Penentuan Statistik Uji Kolmogorov Smirnov
π‘₯𝑖
0,0441
𝑆(π‘₯𝑖 )
0,04
𝐹(π‘₯𝑖 )
0,0441
|𝑆(π‘₯𝑖 ) − 𝐹(π‘₯𝑖 )|
0,0041
|𝑆(π‘₯𝑖−1 ) − 𝐹(π‘₯𝑖 )|
0,0441
0,0711
0,08
0,0711
0,0089
0,0311
0,1349
0,16
0,1349
0,0251
0,0549
0,1702
0,20
0,1702
0,0298
0,0102
0,1988
0,24
0,1988
0,0412
0,0012
0,2063
0,28
0,2063
0,0737
0,0337
0,2071
0,32
0,2071
0,1129
0,0729
0,2760
0,36
0,2760
0,0840
0,0440
0,3433
0,40
0,3433
0,0567
0,0167
0,3466
0,44
0,3466
0,0934
0,0534
0,3492
0,48
0,3492
0,1308
0,0908
0,3603
0,52
0,3603
0,1597
0,1197
0,4368
0,56
0,4368
0,1232
0,0832
0,4574
0,60
0,4574
0,1426
0,1026
0,4798
0,64
0,4798
0,1602
0,1202
0,5074
0,68
0,5074
0,1726
0,1326
0,6398
0,72
0,6398
0,0802
0,0402
0,7080
0,76
0,7080
0,0520
0,0120
0,7662
0,80
0,7662
0,0338
0,0062
0,7808
0,84
0,7808
0,0592
0,0192
0,8015
0,88
0,8015
0,0785
0,0385
0,9011
0,92
0,9011
0,0189
0,0211
0,9391
0,96
0,9391
0,0209
0,0191
0,9571
1,00
0,9571
0,0429
0,0029
61
Buku Ajar Statistika Non Paramaterik
Secara keseluruhan, kesesuaian tersebut dapat diketahui cukup dengan
memperhatikan nilai |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯)| yang terbesar.
Jika nilai selisih terbesar
tersebut cukup kecil, berarti nilai mutlak selisih untuk nilai-nilai yang lain juga akan
cukup kecil. Dengan demikian, pada uji Kolmogorov Smirnov ini secara umum dapat
dipilih nilai |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯)| yang terbesar sebagai statistic uji.
Sebut saja nilai
maksimum tersebut adalah D. Untuk ilustrasi ini, nilai D diperoleh pada x=0,5074
dengan D=0,1726
Untuk ilustrasi ini, karena sebaran teoritis merupakan sebaran yang
kontinu sedangkan sebaran data merupakan fungsi tangga, maka selisih maksimum,
D, tersebut seharusnya diperiksa pada lingkungan (neighborhood) setiap nilai
amatan yang berbeda. Dengan demikian, pada kasus ini, nilai statistic uji tersebut
adalah supremum dari nilai |𝑆(π‘₯) − 𝐹0 (π‘₯)| tersebut, atau dapat dinyatakan sebagai
𝐷 = sup |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|.
1≤𝑖≤𝑁
Dengan demikian, nilai D ini tidak cukup hanya dicari dari kanan suatu nilai x saja,
namun juga dari kiri nilai tersebut. Dengan kata lain, untuk mendapatkan nilai D,
selain memperhatikan nilai |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|, juga harus diperhatikan nilai |𝑆(π‘₯𝑖−1 ) −
𝐹0 (π‘₯𝑖 )| pada setiap nilai π‘₯𝑖 ,. Sebagai contoh, untuk π‘₯𝑖 = 0,4798, diperoleh:
|𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )| = |𝑆(0,4798) − 𝐹(0,4798)| = |0,64 − 0,4798| = 0,1602
dan
|𝑆(π‘₯𝑖−1 ) − 𝐹0 (π‘₯𝑖 )| = |𝑆(0,4574) − 𝐹(0,4798)| = |0,60 − 0,4798| = 0,1202
Nilai |𝑆(π‘₯𝑖−1 ) − 𝐹0 (π‘₯𝑖 )| untuk setiap nilai π‘₯𝑖 dapat dilihat pada Table 2.3.2.
Untuk sebaran teoritis yang kontinu, seperti pada ilustrasi ini, statistic uji D
dapat dinyatakan dengan cara lain, yaitu :
𝐷 = sup |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
1≤𝑖≤𝑁
= max {|𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|, |𝑆(π‘₯𝑖−1 ) − 𝐹0 (π‘₯𝑖 )|}
1≤𝑖≤𝑁
Untuk ilustrasi kasus ini, nilai statistic uji diperoleh dari kolom-4 dan 5 dari
Tabel 3.2.2. Didapat 𝐷 = sup |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )| = 0,1726. Pada gambar 3.2.1, nilai D
1≤𝑖≤𝑁
tersebut diperlihatkan oleh panjang garis putus-putus merah.
Jika nilai statistic uji tersebut dipandang cukup kecil, maka terdapat
kesesuaian antara kedua sebaran kumulatif, sehingga dapat disimpulkan bahwa
62
Buku Ajar Statistika Non Paramaterik
data menyebar menurut sebaran UNIF(0,1) atau dengan kata lain tidak tolak H0.
Sebaliknya, jika nilai statistic uji D tersebut besar berarti tidak terdapat kesesuain
antara sebaran data yang sebenarnya dengan sebaran teoritis yang dihipotesiskan
atau tolak H0. Pada kasus ini, kondisi ini berarti bahwa data tidak berasal dari
populasi UNIF(0,1).
Yang menjadi pertanyaan selanjutnya adalah berapa nilai kritis yang
menjadi batas melakukan penolakan H0 atau tidak melakukan penolakan H0. Untuk
itu diperlukan pengetahuan mengenai sebaran penarikan sampel dari D jika H0
benar. Tabel C pada buku ini dapat digunakan untuk mendapatkan nilai kritis
tersebut, demikian juga dengan nilai-p nya. Perlu dicatat, sebaran penarikan sampel
dari D tidak tergantung dari sebaran teoritis yang dihipotesiskan (bebas sebaran).
Artinya, apapun sebaran teoritis yang dinyatakan pada H0, sebaran penarikan
sampel dari D adalah sama. Dengan demikian, tabel C dapat digunakan untuk
mendapatkan nilai kritis, apapun sebaran yang dihipotesiskan.
Tabel Kolmogorov-Smirnov terdiri dari 2 bagian. Pada bagian 1, disajikan
nilai kritis pengujian untuk berbagai ukutan sample (1≤N≤40), uji satu arah/uji dua
arah dan untuk α=0.01. 0.02, 0.05, 0.1 dan 0.2. Jika N>40, nilai kritis dapat dihitung
dari formula yang disajikan pada bagian 2 dari tabel Kolmogorov-Smirnov tersebut.
Untuk ilustrasi ini, jika taraf nyata pengujian 0.05, untuk N=25 diperoleh
nilai kritis 0.264. Dengan nilai D = 0.1726 < 0.264, diputuskan untuk tidak menolak
H0 dan disimpulkan bahwa pada taraf nyata 5% tidak cukup bukti untuk menolak
bahwa data menyebar menurut sebaran UNIF(0.1).
Sebagai catatan tambahan, jika sebaran teoritis merupakan sebaran
diskret, maka baik sebaran teoritis maupun sebaran data sama-sama berupa fungsi
tangga. Dengan demikian, statistic uji D yang dirumuskan sebagai
𝐷 = sup |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
1≤𝑖≤𝑁
dapat langsung diperoleh dari
𝐷 = max |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
1≤𝑖≤𝑁
Berikut ini, akan diberikan langkah-langkah pengujian hipotesis KolmogorovSmirnov
1. Nyatakan hipotesis
63
Buku Ajar Statistika Non Paramaterik
H0 : Data menyebar menurut sebaran teoritis tertentu
H1 : Data tidak menyebar menurut sebaran teoritis tersebut
2. Tentukan taraf nyata pengujian 𝛼
3. Tentukan statistic yang digunakan,yaitu :
𝐷 = sup |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
1≤𝑖≤𝑁
Jika sebaran teoritis merupakan sebaran kontinu, maka statistic uji dapat
-
dinyatakan sebagai :
𝐷 = max {|𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|, |𝑆(π‘₯𝑖−1 ) − 𝐹0 (π‘₯𝑖 )|}
1≤𝑖≤𝑁
Jika sebaran teoritis merupakan sebaran diskret, maka statistic uji dapat
-
dinyatakan sebagai:
𝐷 = max |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
1≤𝑖≤𝑁
4. Berdasarkan 𝛼 tentukan titik kritis pengujian :
Jika N ≤ 40, gunakan Tabel Kolmogorov-Smirnov bagian 1
Jika N > 40, gunakan Tabel Kolmogorov-Smirnov bagian 2
-
Selanjutnya, tentukan wilayah kritis : 𝐷 > π·π‘‘π‘Žπ‘π‘’π‘™
5. Hitung nilai statistic uji khi kuadrat dengan cara :
a. Susun data pengamatan yang berbeda dari yang terkecil hingga terbesar.
b. Hitung frekuensi dari setiap nilai pengamatan
c. Hitung frekuensi kumulatif, yakni frekuensi data yang nilainya kurang atau
sama dengan nilai pengamatan tersebut
d. Hitung :
𝑆(π‘₯) =
f.
π‘π‘Žπ‘›π‘¦π‘Žπ‘˜π‘›π‘¦π‘Ž π‘π‘’π‘›π‘”π‘Žπ‘šπ‘Žπ‘‘π‘Žπ‘› π‘π‘’π‘Ÿπ‘›π‘–π‘™π‘Žπ‘– π‘˜π‘’π‘Ÿπ‘Žπ‘›π‘” π‘Žπ‘‘π‘Žπ‘’ π‘ π‘Žπ‘šπ‘Ž π‘‘π‘’π‘›π‘”π‘Žπ‘› π‘₯
𝑁
Tentukan 𝐹0 (π‘₯𝑖 ) sesuai dengan sebaran teoritis yang dihipotesiskan. Jika
parameter sebaran tidak dinyatakan pada hipotesis, duga parameter
tersebut terlebih dahulu dari data sampel.
g. Hitung |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|. Jika sebaran teoritis merupakan sebaran kontinu,
hitung juga |𝑆(π‘₯𝑖−1 ) − 𝐹(π‘₯𝑖 )|
h. Hitung nilai statistic uji D seperti yang didefinisikan pada Langkah 3
6. Kriteria penarikan kesimpulan :
Tolak Ho jika D> π·π‘‘π‘Žπ‘π‘’π‘™ dan Tidak tolak H0 jika 𝐷 ≤ π·π‘‘π‘Žπ‘π‘’π‘™
7. Interpretasi :
- Tolak H0 : Pada taraf nyata 𝛼 disimpulkan bahwa data tidak menyebar
menurut sebaran yang dinyatakan pada H0
64
Buku Ajar Statistika Non Paramaterik
- Tidak tolak H0 : Pada taraf nyata 𝛼 , tidak cukup bukti untuk menolak
bahwa data menyebar menurut sebaran yang dinyatakan pada H0.
Contoh 3.2.5
Perhatikan kembali Contoh 3.2.4. Ujilah pada taraf nyata 5% bahwa data jumlah
kasus malaria tersebut menyebar menurut sebaran Poisson.
Solusi
Hipotesis yang diuji adalah :
H0 : Jumlah kasus malaria menyebar menurut sebaran Poisson
H1 : Jumlah kasus malaria tidak menyebar menurut sebaran Poisson
Hipotesis ini akan diuji menggunakan uji Kolmogorov Smirnov pada taraf nyata 5%.
Karena sebaran teoritis merupakan sebaran diskret, maka statistik uji yang
digunakan adalah
𝐷 = max |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|.
1≤𝑖≤𝑁
Nilai 𝑆(π‘₯𝑖 ) diperoleh seperti pada tabel berikut
π‘₯𝑖
frekuensi
0
1
2
3
78
41
15
2
Frekuensi
𝑆(π‘₯𝑖 )
kumulatif
78
78/136=0.5735
119
119/136=0.8750
134
134/136=0.9853
136
136/136=1.000
Karena pada hipotesis awal tidak disertakan nilai dari sebaran Poisson yang akan
diuji, maka parameter ini harus diduga terlebih dahulu dari data sampel. Nilai
dugaan parameter adalah :
⏞
πœ‡=
∑ π‘₯𝑖 ∑ 𝑓𝑖 π‘₯𝑖 78(0) + 41(1) + 15(2) + 2(3)
=
=
= 0.57
𝑁
𝑁
136
Dengan demikian diperoleh fungsi kepekatan peluang sebaran POI(0.57)
𝑓0 (π‘₯) =
𝑒 −πœ‡ πœ‡ π‘₯ 𝑒 −0.57 0.57π‘₯
=
π‘₯!
π‘₯!
untuk π‘₯ = 0,1, …
Selanjutnya, Nilai fungsi sebaran teoritis diperoleh dari :
65
Buku Ajar Statistika Non Paramaterik
π‘₯
π‘₯
𝑑=1
𝑑=1
𝑒 −πœ‡ πœ‡ π‘₯
𝑒 −0.57 0.57π‘₯
𝐹0 (π‘₯) = ∑
=∑
π‘₯!
π‘₯!
Dengan menggunakan kedua fungsi tersebut, diperoleh nilai fungsi sebaran teoritis
nilai π‘₯𝑖 , 𝐹0 (π‘₯𝑖 ), seperti pada tabel berikut.
π‘₯𝑖
0
1
2
3
𝑓0 (π‘₯𝑖 )
0,5677
0,3214
0,0910
0,0171
𝐹0 (π‘₯𝑖 )
0,5677
0,8891
0,9801
0,9972
Dengan demikian, nilai statistic uji D akan diperoleh seperti pada tabel berikut.
π‘₯𝑖
0
1
2
3
𝑆(π‘₯𝑖 )
0.5735
0.8750
0.9853
1.0000
𝐹0 (π‘₯𝑖 )
0,5677
0,8891
0,9801
0,9972
|𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
0,0058
0,0141
0,0052
0,0028
Dengan demikian diperoleh nilai statistic uji
π·β„Žπ‘–π‘‘ = max |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )| = 0,0141
1≤𝑖≤𝑁
Nilai kritis pada pengujian ini diperoleh berdasarkan bagian 2 dari tabel
Kolmogorov-Smirnov. Dengan taraf nyata α=5% dan ukuran sampel N=136, nilai
kritis adalah :
π·π‘‘π‘Žπ‘π‘’π‘™ = 1,36√𝑁 = 1,36/√136 = 0,1166
Karena
π·β„Žπ‘–π‘‘ = 0,0141 < π·π‘‘π‘Žπ‘π‘’π‘™ = 0.1166
maka diputuskan untuk tidak tolak H0 yang berarti bahwa pada taraf nyata 5%,
tidak cukup bukti untuk menolak bahwa data jumlah kasus malaria tersebut
menyebar menurut sebaran Poisson
Nilai fungsi sebaran teoritis biasanya dihitung dari fungsi sebaran
kumulatif yang sesuai dengan sebaran teoritis yang dinyatakan pada hipotesis awal.
Untuk beberapa sebaran, seperti sebaran normal baku, nilai fungsi sebaran
kumulatifnya telah ditabelkan, sehingga untuk jika sebaran teoritis merupakan
sebaran normal baku ataupun sebaran normal lainnya, maka nilai dapat ditentukan
66
Buku Ajar Statistika Non Paramaterik
berdasarkan tabel tersebut 𝐹0 (π‘₯𝑖 ). Hal itu akan diilustrasikan pada contoh berikut.
Sebelumnya akan direview sekilas mengenai sebaran normal ini.
Sebaran normal adalah salah satu sebaran kontinu yang sangat penting
dalam statiatika.
Suatu peubah acak yang menyebar menurut sebaran Normal
dengan parameter µ dan ragam σ2 biasa dinotasikan dengan 𝑋~𝑁(πœ‡, 𝜎 2 ) memiliki
fungsi kepekatan peluang
𝑓(π‘₯) =
1
√2πœ‹πœŽ 2
𝑒
−
1 π‘₯−πœ‡ 2
(
)
2 𝜎
−∞<π‘₯ <∞
dan fungsi sebaran kumulatif
π‘₯
𝐹(π‘₯) = ∫
1
−∞ √2πœ‹πœŽ
2
𝑒
−
1 𝑑−πœ‡ 2
(
)
2 𝜎
−∞<π‘₯ <∞
Salah satu sebaran normal khusus adalah sebaran normal baku yang merupakan
sebaran normal dengan nilai tengah 0 dan ragam 1. Peubah acak normal baku ini
biasa dinotasikan dengan Z, dimana 𝑍~𝑁(0,1).
Fungsi kepakatan peluang dan
fungsi sebaran kumulatif dari suatu peubah acak 𝑍~𝑁(0,1) masing-masing adalah
πœ™(𝑧) =
1
√2πœ‹
𝑒−
1 2
𝑧
2
−∞<𝑧<∞
dan
𝑧
Φ(𝑧) = 𝑃(𝑍 ≤ 𝑧) = ∫
1
−∞ √2πœ‹
𝑒−
1 2
𝑑
2
−∞<𝑧 <∞
Nilai dari fungsi sebaran kumulatif ini dapat dilihat pada tabel normal baku.
Nilai fungsi sebaran kumulatif dari suatu peubah acak 𝑋~𝑁(πœ‡, 𝜎 2 )
dapat
ditentukan menggunakan hubungan antara peubah acak 𝑋~𝑁(πœ‡, 𝜎 2 ) dengan
sebaran normal baku ini, dimana jika 𝑋~𝑁(πœ‡, 𝜎 2 ) maka 𝑍 =
𝑋−πœ‡
~𝑁(0,1).
𝜎
Dengan
demikian, nilai fungsi sebaran kumulatif dari peubah acak 𝑋~𝑁(πœ‡, 𝜎 2 ) dapat
ditentukan dari
π‘₯−πœ‡
)
𝜎
𝐹(π‘₯) = 𝑃(𝑋 ≤ π‘₯) = Φ (
Contoh 3.2.6
Ujilah pada taraf nyata 1%, apakah data berikut ini berasal dari sebaran normal
dengan simpangan baku 3
67
Buku Ajar Statistika Non Paramaterik
-5,-3, -1, -1, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 4, 4, 4, 7, 8
Solusi
Hipotesis yang diuji adalah :
H0 : Data menyebar menurut sebaran N(µ,9)
H1 : Data tidak menyebar menurut sebaran N(µ,9)
Hipotesis ini akan diuji menggunakan uji Kolmogorov Smirnov pada taraf nyata 1%.
Sebaran teoritis yang akan diuji adalah sebaran kontinu sehingga statistik uji yang
akan digunakan adalah :
𝐷 = sup |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
1≤𝑖≤𝑁
= max {|𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|, |𝑆(π‘₯𝑖−1 ) − 𝐹0 (π‘₯𝑖 )|}
1≤𝑖≤𝑁
Nilai 𝑆(π‘₯𝑖 ) diperoleh seperti pada tabel berikut
π‘₯𝑖
Frekuensi
-5
-3
-1
0
1
2
4
7
8
1
1
2
1
5
5
3
1
1
Frekuensi
kumulatif
1
2
4
5
10
15
18
19
20
𝑆(π‘₯𝑖 )
1/20 = 0,050
2/20 = 0,100
4/20 = 0,200
5/20 = 0,250
10/20 = 0,500
15/20 = 0,750
18/20 = 0,900
19/20 = 0,950
20/20 = 1,000
Pada kasus ini, parameter harus diduga terlebih dahulu karena tidak dinyatakan
pada hipotesis awal. Nilai dugaan tersebut adalah :
⏞
πœ‡=
∑ π‘₯𝑖 −5 + (−3) + (−1) + (−1) + β‹― + 8
=
= 1,6
𝑁
20
Selanjutnya, nilai fungsi sebaran teoritis diperoleh dari :
π‘₯ − 1,6
𝐹0 (π‘₯) = Φ (
)
3
Nilai ini diperoleh dari tabel normal baku. Untuk setiap nilai π‘₯𝑖 yang berbeda,
diperoleh nilai 𝐹0 (π‘₯𝑖 ), seperti pada tabel berikut.
68
Buku Ajar Statistika Non Paramaterik
π‘₯𝑖
𝑧𝑖 − 1,6
3
-2,20
-1,53
-0,87
-0,53
-0,20
0,13
0,80
1,80
2,13
𝐹0 (π‘₯𝑖 ) = Φ(𝑧𝑖 )
𝑧𝑖 =
-5
-3
-1
0
1
2
4
7
8
0,0139
0,0630
0,1922
0,2981
0,4207
0,5517
0,7881
0,9641
0,9834
Dengan demikian, nilai statistic uji D akan diperoleh seperti pada tabel berikut.
π‘₯𝑖
-5
-3
-1
0
1
2
4
7
8
𝑆(π‘₯𝑖 )
0,050
0,100
0,200
0,250
0,500
0,750
0,900
0,950
1,000
𝐹0 (π‘₯𝑖 )
0,0139
0,0630
0,1922
0,2981
0,4207
0,5517
0,7881
0,9641
0,9834
|𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
0,0361
0,0370
0,0078
0,0481
0,0793
Dhit=0,1983
0,1119
0,0141
0,0166
Diperoleh nilai π·β„Žπ‘–π‘‘ = 0,1983.
|𝑆(π‘₯𝑖−1 ) − 𝐹0 (π‘₯𝑖 )|
0,0139
0,0130
0,0922
0,0981
0,1707
0,0517
0,0381
0,0641
0,0334
Dari tabel Kolmogorov-Smirnov, untuk
N=20 dan 𝛼 = 0,01, diperoleh nilai kritis π·π‘‘π‘Žπ‘π‘’π‘™ = 0,352. Karena π·β„Žπ‘–π‘‘ = 0,1983 <
π·π‘‘π‘Žπ‘π‘’π‘™ = 0,352 maka diputuskan untuk tidak menolak H0 dan disimpulkan bahwa
pada taraf nyata 1% tidak cukup bukti untuk menolak bahwa data tersebut berasal
dari sebaran normal dengan simpangan baku 3.
3.3 LATIHAN
1. Data berikut adalah nilai angka matakuliah Statistika Nonparametrik .
Nilai
angka
Frekuensi
A
A-
B+
B
B-
C+
C
D
E
16
17
19
15
20
16
14
8
4
Ujilah pada taraf nyata 5% bahwa sebaran nilai matakuliah tersebut mengikuti
sebaran seragam. Gunakan uji Khi Kuadrat
69
Buku Ajar Statistika Non Paramaterik
2.
Data berikut adalah berat ginjal dari sampel yang terdiri dari 36 ekoranjing jenis
tertentu kelinci yang akan digunakan dalam sebuah percobaan. Ujilah, apakah
berat ginjal kelinci pada sampel tersebut berasal dari sebuah sebaran normal
dengan nilai tengah 85 gram dan simpangan baku 15 gram.
58
59
68
80
78
90
93
68
84
70
70
82
90
74
94
104
97
83
70
92
70
90
110
112
90
75
67
84
86
88
68
98
82
84
75
80
3.4 RANGKUMAN
Uji kebaikan suai adalah uji statistika yang digunakan untuk menguji
kesesuaian sebaran populasi dengan suatu sebaran teoritis tertentu yang dilakukan
berdasarkan data sampel. Terdapat dua uji kebaikan suai yang dapat dilakukan,
yakni uji khi kuadrat dan uji Kolmogorov smirnov.
Langkah-langkah uji khi kuadrat adalah :
1. Nyatakan hipotesis
H0 : Fungsi peluang dari variabel yang teramati adalah 𝐹𝑋 (π‘₯)
H1 : Fungsi peluang dari variabel yang teramati adalah selain 𝐹𝑋 (π‘₯)
Hipotesisi ini dapat juga dinyatakan dalam
H0 : 𝑝𝑖 = 𝑝𝑖0 untuk semua i=1,2,…,r
H1 : 𝑝𝑖 ≠ 𝑝𝑖0 untuk beberapa i=1,2,…,r
2. Tentukan taraf nyata pengujian 𝛼
3. Tentukan statistic yang digunakan,yaitu :
π‘Ÿ
𝑄=∑
𝑖=1
(𝑓𝑖 − 𝑒𝑖 )2
𝑒𝑖
4. Berdasarkan 𝛼 tentukan :
-
titik kritis
2
: πœ’π‘Ÿ−1,𝛼
(r adalah jumlah kategori dan r-1 adalah derajat
bebas)
-
2
2
wilayah kritis : 𝑄 > πœ’π‘Ÿ−1,𝛼
atau wilayah penerimaan : 𝑄 ≤ πœ’π‘Ÿ−1,𝛼
Alternatif lain adalah dengan menentukan p-value berdasarkan nilai Q
yang diperoleh
5. Hitung nilai statistic uji khi kuadrat dengan cara :
i. (opsional) Duga parameter sebaran dari data
70
Buku Ajar Statistika Non Paramaterik
j. (opsional) Duga nilai 𝑝𝑖0
k. Tentukan frekuensi harapan
𝑒𝑖 = 𝑁𝑝𝑖0
l. Hitung selisih 𝑓𝑖 − 𝑒𝑖 untuk setiap kategori, kuadratkan selanjutnya
bagi dengan 𝑒𝑖 , sehingga diperoleh (𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖
m. Jumlahkan nilai (𝑓𝑖 − 𝑒𝑖 )2 /𝑒𝑖 untuk setiap i, sehingga diperoleh nilai
π‘Ÿ
𝑄=∑
𝑖=1
(𝑓𝑖 − 𝑒𝑖 )2
𝑒𝑖
6. Kriteria penarikan kesimpulan
-
2
Tolak Ho jika 𝑄 > πœ’π‘Ÿ−1,𝛼
-
2
Tidak tolak H0 jika 𝑄 ≤ πœ’π‘Ÿ−1,𝛼
7. Interpretasi :
-
Tolak H0 : Pada taraf nyata 𝛼 disimpulkan bahwa data tidak menyebar
menurut sebaran yang dinyatakan pada H0
-
Tidak tolak H0 : Pada taraf nyata 𝛼 , tidak cukup bukti untuk menolak
bahwa data menyebar menurut sebaran yang dinyatakan pada H0.
Langkah-langkah pengujian Kolmogorov-Smirnov adalah :
1. Nyatakan hipotesis
H0 : Data menyebar menurut sebaran teoritis tertentu
H1 : Data tidak menyebar menurut sebaran teoritis tersebut
2. Tentukan taraf nyata pengujian 𝛼
3. Tentukan statistic yang digunakan,yaitu :
𝐷 = sup |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
1≤𝑖≤𝑁
-
Jika sebaran teoritis merupakan sebaran kontinu, maka statistic uji dapat
dinyatakan sebagai :
𝐷 = max {|𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|, |𝑆(π‘₯𝑖−1 ) − 𝐹0 (π‘₯𝑖 )|}
1≤𝑖≤𝑁
-
Jika sebaran teoritis merupakan sebaran diskret, maka statistic uji dapat
dinyatakan sebagai:
71
Buku Ajar Statistika Non Paramaterik
𝐷 = max |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|
1≤𝑖≤𝑁
4. Berdasarkan 𝛼 tentukan titik kritis pengujian :
-
Jika N ≤ 40, gunakan Tabel Kolmogorov-Smirnov bagian 1
-
Jika N > 40, gunakan Tabel Kolmogorov-Smirnov bagian 2
Selanjutnya, tentukan wilayah kritis : 𝐷 > π·π‘‘π‘Žπ‘π‘’π‘™
5. Hitung nilai statistic uji Kolmogorv-Smirnov dengan cara :
a. Susun data pengamatan yang berbeda dari yang terkecil hingga terbesar.
b. Hitung frekuensi dari setiap nilai pengamatan
c. Hitung frekuensi kumulatif, yakni frekuensi data yang nilainya kurang atau
sama dengan nilai pengamatan tersebut
d. Hitung :
𝑆(π‘₯) =
π‘π‘Žπ‘›π‘¦π‘Žπ‘˜π‘›π‘¦π‘Ž π‘π‘’π‘›π‘”π‘Žπ‘šπ‘Žπ‘‘π‘Žπ‘› π‘π‘’π‘Ÿπ‘›π‘–π‘™π‘Žπ‘– π‘˜π‘’π‘Ÿπ‘Žπ‘›π‘” π‘Žπ‘‘π‘Žπ‘’ π‘ π‘Žπ‘šπ‘Ž π‘‘π‘’π‘›π‘”π‘Žπ‘› π‘₯
𝑁
e. Tentukan 𝐹0 (π‘₯𝑖 ) sesuai dengan sebaran teoritis yang dihipotesiskan. Jika
parameter sebaran tidak dinyatakan pada hipotesis, duga parameter
tersebut terlebih dahulu dari data sampel.
f. Hitung |𝑆(π‘₯𝑖 ) − 𝐹0 (π‘₯𝑖 )|.
Jika sebaran teoritis merupakan sebaran kontinu,
hitung juga |𝑆(π‘₯𝑖−1 ) − 𝐹(π‘₯𝑖 )|
g. Hitung nilai statistic uji D seperti yang didefinisikan pada Langkah 3
6. Kriteria penarikan kesimpulan :
Tolak Ho jika D> π·π‘‘π‘Žπ‘π‘’π‘™ dan Tidak tolak H0 jika 𝐷 ≤ π·π‘‘π‘Žπ‘π‘’π‘™
7. Interpretasi :
- Tolak H0 : Pada taraf nyata 𝛼 disimpulkan bahwa data tidak menyebar
menurut sebaran yang dinyatakan pada H0
- Tidak tolak H0 : Pada taraf nyata 𝛼 , tidak cukup bukti untuk menolak
bahwa data menyebar menurut sebaran yang dinyatakan pada H0.
72
Buku Ajar Statistika Non Paramaterik
3.5 PENUTUP
3.5.1 Test Formatif
Kerjakan soal berikut
1. Dua jenis jagung baru (bulir berwarna ungu dan merah) membawa gen
resesif. Bila dua jenis jagung ini disilangkan, akan diperoleh generasi
pertama yang semuanya normal (tidak berbulir ungu maupun merah). Bila
jagung pada generasi pertama ini dikembangkan, maka akan diperoleh 4
jenis jagung : normal, berbulir ungu, berbulir merah dan berbulir
campuran ungu-merah. Dari 1.290 pohon jagung yang dihasilkan pada
generasi kedua ini, diperoleh hasil
Tipe
Normal
Bulir ungu
Bulir merah
Bulir ungu-merah
Jumlah
760
230
238
62
Menurut hukum Mendel, distribusi hibrida pada generasi kedua ini
seharusnya adalah 9:3:3:1. Apakah data yang diperoleh tersebut konsisten
dengan Hukum Mendel? Gunakan taraf nyata 5%.
2. Dalam memodelkan antrian, peneliti biasanya tidak hanya tertarik pada
struktur
dasar
dari
system
antrian,
namun
juga
pada
proses
kedatangan/input. Disiplin antrian dan proses layanan/output. Suatu model
yang umum digunakan model single-channel/single phase dimana proses
kedatangan diasumsikan berdistribusi Poisson, disimplin antrian FIFO dan
waktu pelayanan yang diasumsikan berdistribusi Eksponensial.
Untuk
mendukung pemodelan yang akan dilakukannya, peneliti mengambil data
dan ia peroleh data waktu pelayanan sebagai berikut :
0,6
11,9
23,1
1,6
13,5
23,8
3,2
15,1
23,9
3,3
15,7
26,4
3,5
16,2
27,9
3,8
16,3
37,4
5,9
18,5
39,6
6,2
18,7
40,0
6,8
20,7
60,4
11,3
22,0
63,0
73
Buku Ajar Statistika Non Paramaterik
Ujilah, apakah data tersebut mendukung pemodelan yang akan
dilakukannya, bahwa data lama pelayanan di atas diambil dari sebaran
eksponensial
Catatan :
π‘₯
ο‚·
Jika 𝑋_𝐸𝑋𝑃(πœ†) maka 𝐹(π‘₯) = 1 − 𝑒 −πœ†
ο‚·
∑
π‘₯𝑖
Penduga parameter ekponensi πœ† al : ⏞
πœ† = 𝑖=1
𝑁
π‘₯ > 0.
𝑁
3. Empat buah koin dilemparkan sekaligus dan dicatat banyaknya sisi angka
yang muncul. Percobaan semacam itu dilakukan dalam 160 kali
ulangan. Diperoleh hasil sebagai berikut.
Banyaknya sisi
yang muncul
0
1
2
3
4
angka Frekuensi
16
48
55
33
8
Gunakan uji Kolmogorov-Smirnov untuk menguji bahwa banyaknya sisi
yang muncul tersebut berasal dari sebaran Binomial(4,1/2). Dengan kata
lain bahwa koin yang digunakan adalah koin yang setimbang.
3.5.2. Umpan balik dan Tindak Lanjut
Cocokkan jawaban Anda dengan Kunci Jawaban Test Formatif yang
terdapat di akhir bab ini.
Soal 1. (Total nilai 30). Setiap tahap bernilai 5.
Soal 2. (Total nilai 40). Setiap tahap bernilai 5, kecuali penentuan statistik nilai
uji bernilai 15
Soal 3. (Total nilai 30). Setiap tahap pengujian bernilai 5
Tingkat penguasaan anda terhadap materi diukur dengan rumus :
Tk Penguasaan ο€½
Total Nilai
100
Arti tingkat penguasaan yang Anda capai :
74
Buku Ajar Statistika Non Paramaterik
90% - 100 % : Baik sekali
80% - 89%
: Baik
60% - 79%
: Cukup
0% - 59% : Kurang
3.5.3 Kunci jawaban
2
1. Qhit=61,16; πœ’3,0.05
= 7.82; Tolak Ho
2.
3.
3.5.4.
Istilah dan Kata Penting
Uji Kebaikan Suai : Pengujian hipotesis yang dilakukan untuk menguji
kecocokan sebaran data dengan suatu sebaran teoritis tertentu
3.5.5.
Daftar Pustaka
Gibbon, J.D. 1975. Nonparametric Methods for Quantitative Analysis. International
Series in Decision Processes. NRW Publishing, Alabama
75
Download