PENGUJIAN HIPOTESIS PADA REGRESI
KUANTIL
Nurwahida Astari, Amran, Andi Kresna Jaya
Departemen Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Hasanuddin
E-mail: nurwahida.astari95yahoo.co.id
Abstrak
Umumnya, pengujian hipotesis pada analisis regresi didasarkan pada asumsi error
berdistribusi normal dengan π = 0 dan variansi π 2 . Namun, asumsi error berdistribusi
normal tidak dipenuhi pada kelompok data dengan bentuk distribusi tidak simetris. Salah
satu metode analisis untuk data yang berdistribusi tidak simetris adalah regresi kuantil.
Pengujian hipotesis pada regresi kuantil menjadi suatu masalah penting yang perlu diatasi.
Tugas akhir ini membahas tentang pengujian hipotesis pada regresi kuantil menggunakan
uji Wald. Estimasi parameter menggunakan metode interior point dengan algoritma
Frisch-Newton. Ditunjukkan bahwa distribusi asimtotik estimator berdistribusi normal
(0, π0 ). Dari distribusi asimtotik tersebut diperoleh fungsi sparsity. Rumusan fungsi
sparsity digunakan untuk mengkonstruksi statistik uji Wald yang berdistribusi chi-square
dengan derajat bebas π. Aplikasi pengujian hipotesis pada regresi kuantil menggunakan
kuantil atas menunjukkan bahwa Sea Surface Temperature (SST) Niño 3.4 memberikan
pengaruh yang signifikan terhadap curah hujan di Kota Makassar pada kuantil 0.75, 0.80,
0.85, 0.90, dan 0.95.
Kata Kunci:
Regresi Kuantil, Interior Point, Asimtotik Distribusi Normal, Fungsi
Sparsity, Uji Wald, Curah Hujan, SST Niño 3.4.
Pendahuluan
Analisis regresi dalam ilmu statistika merupakan salah satu metode statistik
yang digunakan untuk melihat apakah ada hubungan yakni sebab dan akibat antara
dua atau lebih variabel. Variabel dibagi menjadi dua jenis yaitu variabel terikat dan
variable bebas. Analisis regresi memerlukan suatu metode untuk estimasi parameter
yang memenuhi sifat Best Liniear Unbiased Estimator (BLUE). Salah satu metode
estimasi yang sering digunakan adalah Ordinary Least Square (OLS). Analisis
regresi menggunakan metode OLS berdasarkan pada fungsi mean. Perkembangan
metode estimasi parameter model dengan data berdistribusi tidak simetris dimulai
dengan metode Least Absolute Deviation (LAD) dan dikenal sebagai regresi kuantil
median. Nilai estimasi parameter dengan menggunakan metode LAD dapat
diperoleh dengan meminimumkan jumlah nilai mutlak dari error. Selain regresi
kuantil median dikenal juga regresi kuantil.
Regresi kuantil adalah salah satu metode regresi dengan memisahkan atau
membagi data menjadi kuantil-kuantil tertentu dimana diduga terdapat perbedaan
nilai estimasi. Regresi kuantil pertama kali diperkenalkan oleh Koenker dan Basset
(1978). Rahmawati dkk (2011) meneliti regresi kuantil mengenai studi kasus pada
data suhu harian. Navianti (2014) membahas mengenai regresi kuantil untuk
pemodelan tingkat pengangguran terbuka di Indonesia. Rahmawati dkk (2011)
hanya berfokus pada estimasi parameter regresi kuantil dan Navianti (2014)
berfokus pada selang kepercayaan pada regresi kuantil.
Regresi kuantil sangat berguna untuk data dengan distribusi tidak simetris,
dalam bidang meteorologi dapat diterapkan pada data curah hujan, temperatur, dan
perubahan iklim. Data curah hujan merupakan data musiman, sehingga pada waktu
tertentu (Desember, Januari, Februari) terjadi hujan lebat. Kejadian Hujan lebat
dapat dimodelkan dengan menggunakan analisis regresi kuantil bagian atas,
khususnya untuk nilai ekstrem. Kombinasi dari setiap nilai kuantil dapat
menjelaskan pola keseluruhan data sehingga bermanfaat untuk menganalisa bagian
tertentu dari sebaran bersyarat.
Pengujian hipotesis merupakan hal yang penting dalam tahapan analisis
regresi. Pengujian hipotesis pada analisis regresi didasarkan pada asumsi error
berdistribusi normal dengan π = 0 dan variansi π 2 dengan data yang berdistribusi
simetris. Asumsi error tersebut umumnya tidak dipenuhi pada data kuantil atas
yang berdistribusi tidak simetris. Berdasarkan asumsi tersebut penulis tertarik untuk
membahas “Pengujian Hipotesis pada Regresi Kuantil”.
Regresi Kuantil
Misalnya π merupakan suatu variabel acak dengan suatu fungsi distribusi
πΉπ dan π merupakan konstanta dimana 0 < π < 1. Kuantil ke- π dari πΉπ ,
dinotasikan sebagai ππ (π) merupakan solusi untuk πΉπ (π) = π, adalah sebagai
berikut:
ππ¦ (π) β πΉπ¦−1 (π) = inf{π¦ βΆ πΉπ (π¦) ≥ π}.
Seperti halnya dengan suatu metode OLS yang digunakan sebagai meminimumkan
jumlah kuadrat error (sisaan) untuk menentukan suatu nilai parameter π½, maka
dalam analisis regresi kuantil, kuantil ke- π dari πΉπ dapat diperoleh dengan
meminimumkan suatu fungsi berikut ini terhadap π:
|π¦ − π|ππΉπ (π¦) + (1 − π) ∫
π∫
π¦>π
= π∫
|π¦ − π|ππΉπ (π¦)
π¦<π
(π¦ − π)ππΉπ (π¦) − (1 − π) ∫
π¦>π
(π¦ − π)ππΉπ (π¦).
(1)
π¦<π
Dengan meminimumkan fungsi persamaan (1), dapat diperoleh persamaan berikut
ini:
0 = −π ∫
ππΉπ (π¦) + (1 − π) ∫
π¦>π
ππΉπ (π¦)
π¦<π
0 = −π[1 − πΉπ (π)] + (1 − π)πΉπ (π)
0 = −π + πΉπ (π)
sehingga diperoleh:
π = πΉπ (π),
sehingga persamaan (2) merupakan kuantil ke- π adalah solusi dari πΉπ .
(2)
Misalkan π sebagai suatu fungsi dari π yang telah diketahui, yang memiliki
peluang yaitu πΉπ|π (π¦), maka kuantil ke- π dari fungsi tersebut dapat dituliskan
−1
(π). ππ|π (π) ini merupakan suatu fungsi dari π dan dapat
sebagai ππ|π (π) β πΉπ|π
diselesaikan dengan persamaan berikut ini:
min [π ∫ |π¦ − π|ππΉπ¦ (π¦) + (1 − π) ∫ |π¦ − π|ππΉπ¦ (π¦)].
π
π¦>π
(3)
π¦<π
Jika ππ|π (π) adalah fungsi linier πΏπ·, dengan vektor parameter π½ yang tidak
diketahui, sehingga persamaan (3) menjadi:
|π¦ − ππ½|ππΉπ (π¦) + (1 − π) ∫
min [π ∫
π½
π¦>ππ½
|π¦ − ππ½|ππΉπ (π¦)] .
(4)
π¦<ππ½
Solusi dari persamaan (4) ini dinotasikan sebagai π½0 dan kuantil π (sebagai fungsi
dari π) ke- π adalah ππ|π (π) = ππ½0 (Kuan, 2007).
ππ|π (π) = π₯π‘ π½ adalah kuantil ke-π (0 < π < 1) yang nilai π¦ tergantung
terhadap π₯π‘ . Suatu nilai estimasi terhadap π½ dari regresi kuantil ke-π diperoleh
dengan meminimumkan jumlah nilai mutlak dari error dengan pembobot π untuk
error positif dan pembobot (1 − π) untuk error negatif adalah:
π½Μ (π) = arg min {π ∑ |π¦π‘ − π₯π‘ π½| + (1 − π) ∑ |π¦π‘ − π₯π‘ π½|}
π½
π‘:π¦π‘ ≥π₯π‘
(5)
π‘:π¦π‘ <π₯π‘
atau
π½Μ (π) = arg min ∑
π½
π
ππ (π’π )
π=1
(6)
untuk:
ππ’π
ππ (π’π ) = {
(π − 1)π’π
jika π’π ≥ 0
jika π’π < 0
Solusi dari persamaan (5) atau (6) tidak dapat diperoleh secara analitik,
melainkan dikerjakan secara numerik, seperti metode simplex, metode interior
point, atau metode smoothing.
Pengujian Hipotesis
Analisis regresi kuantil diterapkan pada sampel yang berukuran besar, maka
parameter regresi kuantil menggunakan uji Wald. Asumsi hipotesis linier adalah
πΉπ½π = π, dimana πΉ adalah matriks dengan full row rank berukuran π × π, dan π
adalah vektor berukuran π × 1 pada nilai hipotesis.
Rumusan hipotesis yang digunakan dalam penelitian ini adalah sebagai berikut:
π»0 : π½ = 0
π»1 : π½ ≠ 0
A. Inferensi Asimtotik pada Regresi Kuantil
Dalam regresi kuantil terdapat fungsi kuantil bersyarat ke-π yang
mempertimbangkan estimasi π½(π), sehingga diperoleh solusi pada persamaan (6)
atau dinyatakan pada persamaan (7):
π½Μ (π) = arg min ∑
π½
π
ππ (ππ − ππ π½).
(7)
π=1
Beberapa kondisi yang digunakan Newey dan McFadden (1994) terhadap
teorema asimtotik normal sebagai berikut:
π
1
−1
(8)
∑ ππ {1[ππ ≤ ππ½(π)] − π} + ππ (1)
√π[π½Μ (π) − π½(π)] = π0
√π π=1
Berdasarkan persamaan (8) π0 adalah Hessian terhadap limit fungsi loss, dan
1
π
π
∑ ππ {1[ππ ≤ ππ½(π)] − π} → π©(0, π0 )
√π π=1
dengan:
π0 = πΈ({1[ππ ≤ ππ½(π)] − π}2 ππ ππ′ ) = π(1 − π)πΈ(π ′ ππ ).
Perhatikan bahwa asumsi linier pada kuantil bersyarat adalah dinyatakan dalam
persamaan (9) dan (10):
π
(9)
√π[π½Μ (π) − π½(π)] → π©(0, π0 )
dimana:
π(1 − π)
[πΈ(ππ′ ππ )]−1 .
π0 =
(10)
2
−1
π(πΉ (π))
B. Menentukan Nilai Statistik Uji
Μπ
Uji Wald digunakan pada regresi kuantil untuk mengecek apakah πΉπ·
signifikan terhadap hipotesis nilai π. Asumsi bahwa estimasi konsisten lemah untuk
−1 (π)). Sehingga dari persamaan (7) diperoleh
π(πΉ −1 (π)) dinotasikan dengan π(πΉΜ
hipotesis nol seperti berikut ini:
π΄
π(1 − π)
Μ
[πΈ(ππ′ ππ )]−1 )
√π[π½ (π) − π½(π)] ~ π© (0,
2
−1
π(πΉ (π))
−1 (π))
π(πΉ
> 0 memiliki kepadatan positif dimana πΉ −1 (π) = π(π), dengan
parameter skala
π(1−π)
π(πΉ−1 (π))
2
menjadi fungsi π (π) =
1
π(πΉ −1 (π))
2
yang disebut sebagai
fungsi sparsity. Parzen (1979) menyatakan bahawa fungsi sparsity adalah fungsi
kepadatan kuantil. Nilai π(πΉ −1 (π)) tidak diketahui dan harus diestimasi. Estimasi
telah diusulkan Siddiqui (1960) dalam buku Davino dkk (2014) menyatakan bahwa:
1
π (π) =
−1
π(πΉ (π))
(11)
−1 (π
πΉ
+ β) − πΉ −1 (π − β)
=
2β
Bandwidth β dari fungsi πΉ harus didefinisikan. Koenker dan Machado (1999)
menyarankan menggunakan bandwidth:
β=
1
1 2 1.5π 4 (Φ −1 (π)) 3
π −3 π 3 [
]
(2Φ−1 (π)2 + 1)
(12)
Berdasarkan teorema Slutsky dan sifat distribusi normal, mengalikan πΉ pada
distribusi maka diperoleh:
π΄
Μ
Μ
(π)
πΉ√π[π½
− π½(π)] = √π(πΉπ½(π) − π) ~ π©(0, πΉπΎπ πΉ′ ).
Dengan hukum bilangan besar lemah, ππ = π−1 ∑ππ=1 π′π ππ konsisten terhadap
πΈ(ππ′ ππ ). Estimasi konsisten lemah untuk π0 adalah:
π(1 − π)
Μ0 =
[ππ ]−1
π
2
−1
π(πΉ (π))
atau:
Μ0 =
π
π(1 − π)
π(πΉ −1 (π))
π
2 [π
−1
−1
∑ π′π ππ ]
π=1
(13)
sehingga:
1
π΄
−
2
Μ
Μ
Γπ √π(πΉπ½(π) − π) ~ π©(0, π°π )
1
Μ π πΉ′ .
dimana ΓΜ −2 = πΉπΎ
1
Μ π − π) merupakan vektor berdistribusi normal. Hasil kali dalam
ΓΜ −2 (πΉπ·
antara vektor tersebut sehingga diperoleh statistik uji Wald berikut ini:
π΄
1
Μ π − π)′ ΓΜ −2 (πΉπ·
Μ π − π) ~ π 2 (π)
(14)
π²π (π) = π(πΉπ·
C. Kriteria Penerimaan dan Penolakan π»0
Jika nilai π²π (π) ≥ nilai tabel chi-square maka π»0 ditolak
Jika nilai π²π (π) < nilai tabel chi-square maka π»0 tidak ditolak
Aplikasi Pengujian Hipotesis Pada Regresi Kuantil
Data yang digunakan berupa data curah hujan bulanan dan Sea Surface
Temperature (SST) Niño 3.4. Data curah hujan diperoleh dari BMKG Maros yaitu
data curah hujan Stasiun Meteorologi Hasanuddin Makassar periode Januari 1983September 2015. Data SST Niño 3.4 diperoleh dari internet
http://www.esrl.noaa.gov/psd/gcos_wgsp/Timeseries/Nino34/. Program komputer
yang digunakan untuk mendukung proses penelitian ini adalah program RStudio.
Berdasarkan fungsi kuantil π ∈ [0.1] dapat didekati dalam bentuk fungsi
distribusi empiris. Grafik fungsi distribusi empiris adalah sebagai berikut:
Gambar (a) Fungsi Distribusi Empiris
πΉπ¦ (π)
Gambar (b) Fungsi Distribusi
Empiris ππ (π)
Berdasarkan gambar (b) dapat disimpulkan bahwa ππ (0.75) = 405, yang
berarti pada data curah hujan nilai kuantil 0.75 berada disekitaran 405, kuantil 0.80
berada disekitaran 493, kuantil 0.85 berada disekitaran 552, kuantil 0.90 berada
disekitaran 687, dan kuantil 0.95 berada disekitaran 863.
Tabel 1.1 Hasil estimasi parameter regresi kuantil
Kuantil
0.75
0.80
0.85
0.90
0.95
Sumber: hasil olah data
Intercept (π½0 )
403.8846
481.7586
533.6131
643.8378
824.8028
Kemiringan (π½1 )
−113.4615
−117.2414
−98.0926
−121.6216
−64.6789
Nilai estimasi parameter π½0 berbanding lurus dengan kuantil dalam hal ini
semakin besar kuantil yang dipilih, maka nilai estimasi parameter π½0 meningkat.
Persamaan regresi untuk kuantil 75%, 80%, 85%, 90%, dan 95% adalah sebagai
berikut:
π75% = 403.8846 − 113.4615π
π80% = 481.7586 − 117.2414π
π85% = 533.6131 − 98.0926π
π90% = 643.8378 − 121.6216π
π95% = 824.8028 − 64.6789π
Selang kepercayaan estimasi parameter π½0 dan π½1 menggunakan πΌ = 0.05 untuk
kelima kuantil atas adalah sebagai berikut:
Tabel 1. 2 Selang kepercayaan terhadap estimasi parameter
Kuantil
π½0
75%
354.8393 − 451.5338
80%
430.1285 − 522.6401
85%
512.1712 − 610.0504
90%
609.2118 − 739.2684
95%
772.1026 − 917.2122
Sumber: hasil olah data
π½1
−144.9374 − (−55.1881)
−145.5004 − (−77.0079)
−151.6838 − (−76.6799)
−146.3982 − (−68.4706)
−175.0718 − 7.7018
Gambar (c) Plot estimasi parameter regresi kuanti pada kuantil atas
Nilai bandwidth berdasarkan pada persamaan (12) adalah:
Tabel 1. 3 Nilai bandwidth berdasarkan data menggunakan program RStudio.
Kuantil
0.75
β
0.0919
Sumber: hasil olah data
0.80
0.0781
0.85
0.0633
0.90
0.0472
0.95
0.0290
Nilai fungsi sparsity berdasarkan persamaan (4.10) pada kuantil 0.75, 0.80, 0.85,
0.90, dan 0.95 adalah sebagai berikut:
Kuantil 0.75 adalah 7.4715 × 10−4
Kuantil 0.80 adalah 5.6522 × 10−4
Kuantil 0.85 adalah 4.6520 × 10−4
Kuantil 0.90 adalah 3.2218 × 10−4
Kuantil 0.95 adalah 2.1887 × 10−4
Μ0 pada kuantil
Berdasarkan persamaan (13) nilai estimasi konsisten lemah untuk π
0.75, 0.80, 0.85, 0.90, dan 0.95 adalah sebagai berikut:
330005.1055
Kuantil 0.75 adalah [
13200.2042
13200.2042
]
435606.7392
492064.9827
Kuantil 0.80 adalah [
19682.5993
19682.5993
]
649525.7771
578849.1751
Kuantil 0.85 adalah [
23153.9670
23153.9670
]
764080.9112
851878.6127
Kuantil 0.90 adalah [
34075.1445
34075.1445
]
1124479.7688
974214.0531
Kuantil 0.95 adalah [
38968.5621
38968.5621
]
1285962.5501
Menentukan nilai statistik uji pada regresi kuantil menggunakan uji Wald
berdasarkan persamaan (14) maka nilai uji Wald pada kuantil 0.75, 0.80, 0.85, 0.90,
0.95 adalah sebagai berikut:
π²99 (0.75) = 5.7647 × 1012
π²79 (0.80) = 9.5518 × 1012
π²59 (0.85) = 1.0015 × 1013
π²39 (0.90) = 1.4213 × 1013
π²20 (0.95) = 1.3280 × 1013
Penerimaan dan Penolakan π»0
π²99 (0.75) ≥ π 2 (99) atau 5.7647 × 1012 ≥ 123.2252
π²79 (0.80) ≥ π 2 (79) atau 9.5518 × 1012 ≥ 100.7486
π²59 (0.85) ≥ π 2 (59) atau 1.0015 × 1013 ≥ 77.9305
π²39 (0.90) ≥ π 2 (39) atau 1.4213 × 1013 ≥ 54.5722
π²20 (0.95) ≥ π 2 (20) atau 1.3280 × 1013 ≥ 31.4104
Kesimpulan
Untuk mendapatkan statistik uji Wald perlu ditunjukkan bahwa distribusi
asimtotik estimator berdistribusi normal (0, π0 ). Dari distribusi asimtotik tersebut
diperoleh fungsi sparsity. Rumusan fungsi sparsity digunakan untuk
mengkonstruksi statistik uji Wald yang berdistribusi chi-square dengan derajat
bebas π. Pengaplikasian pengujian hipotesis pada regresi kuantil menunjukkan
bahwa SST Niño 3.4 memberi pengaruh yang signifikan terhadap curah hujan
ekstrem di Kota Makassar.
Daftar Pustaka
Davino, C., Furno, M., & Vistocco, D. (2014). Quantile Regression Theory and
Applications. Wiley.
Koenker, R., & Bassett, Jr., G. (1978). Regression quantile. Econometrica. 46; 3350.
Kuan, C.-M. (2007). An Introduction To Quantile Regression. Econometrica.
Institute of Economics, Academia Sinica.
Navianti, D. R. (2014). Regresi Kuantil Untuk Pemodelan Tingkat Pengangguran
Terbuka di Indonesia. In Skripsi. Institut Teknologi Sepuluh Nopember.
Newey, W., & McFadden, D. (1994). Large Sample Estimation and Hypothesis
Testing, in R.
Rahmawati, R., Widiarti, & Novianti, P. (2011). Regresi Kuantil (Studi Kasus Pada
Suhu Harian).