PENGUJIAN HIPOTESIS PADA REGRESI KUANTIL Nurwahida Astari, Amran, Andi Kresna Jaya Departemen Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Hasanuddin E-mail: nurwahida.astari95yahoo.co.id Abstrak Umumnya, pengujian hipotesis pada analisis regresi didasarkan pada asumsi error berdistribusi normal dengan π = 0 dan variansi π 2 . Namun, asumsi error berdistribusi normal tidak dipenuhi pada kelompok data dengan bentuk distribusi tidak simetris. Salah satu metode analisis untuk data yang berdistribusi tidak simetris adalah regresi kuantil. Pengujian hipotesis pada regresi kuantil menjadi suatu masalah penting yang perlu diatasi. Tugas akhir ini membahas tentang pengujian hipotesis pada regresi kuantil menggunakan uji Wald. Estimasi parameter menggunakan metode interior point dengan algoritma Frisch-Newton. Ditunjukkan bahwa distribusi asimtotik estimator berdistribusi normal (0, π0 ). Dari distribusi asimtotik tersebut diperoleh fungsi sparsity. Rumusan fungsi sparsity digunakan untuk mengkonstruksi statistik uji Wald yang berdistribusi chi-square dengan derajat bebas π. Aplikasi pengujian hipotesis pada regresi kuantil menggunakan kuantil atas menunjukkan bahwa Sea Surface Temperature (SST) Niño 3.4 memberikan pengaruh yang signifikan terhadap curah hujan di Kota Makassar pada kuantil 0.75, 0.80, 0.85, 0.90, dan 0.95. Kata Kunci: Regresi Kuantil, Interior Point, Asimtotik Distribusi Normal, Fungsi Sparsity, Uji Wald, Curah Hujan, SST Niño 3.4. Pendahuluan Analisis regresi dalam ilmu statistika merupakan salah satu metode statistik yang digunakan untuk melihat apakah ada hubungan yakni sebab dan akibat antara dua atau lebih variabel. Variabel dibagi menjadi dua jenis yaitu variabel terikat dan variable bebas. Analisis regresi memerlukan suatu metode untuk estimasi parameter yang memenuhi sifat Best Liniear Unbiased Estimator (BLUE). Salah satu metode estimasi yang sering digunakan adalah Ordinary Least Square (OLS). Analisis regresi menggunakan metode OLS berdasarkan pada fungsi mean. Perkembangan metode estimasi parameter model dengan data berdistribusi tidak simetris dimulai dengan metode Least Absolute Deviation (LAD) dan dikenal sebagai regresi kuantil median. Nilai estimasi parameter dengan menggunakan metode LAD dapat diperoleh dengan meminimumkan jumlah nilai mutlak dari error. Selain regresi kuantil median dikenal juga regresi kuantil. Regresi kuantil adalah salah satu metode regresi dengan memisahkan atau membagi data menjadi kuantil-kuantil tertentu dimana diduga terdapat perbedaan nilai estimasi. Regresi kuantil pertama kali diperkenalkan oleh Koenker dan Basset (1978). Rahmawati dkk (2011) meneliti regresi kuantil mengenai studi kasus pada data suhu harian. Navianti (2014) membahas mengenai regresi kuantil untuk pemodelan tingkat pengangguran terbuka di Indonesia. Rahmawati dkk (2011) hanya berfokus pada estimasi parameter regresi kuantil dan Navianti (2014) berfokus pada selang kepercayaan pada regresi kuantil. Regresi kuantil sangat berguna untuk data dengan distribusi tidak simetris, dalam bidang meteorologi dapat diterapkan pada data curah hujan, temperatur, dan perubahan iklim. Data curah hujan merupakan data musiman, sehingga pada waktu tertentu (Desember, Januari, Februari) terjadi hujan lebat. Kejadian Hujan lebat dapat dimodelkan dengan menggunakan analisis regresi kuantil bagian atas, khususnya untuk nilai ekstrem. Kombinasi dari setiap nilai kuantil dapat menjelaskan pola keseluruhan data sehingga bermanfaat untuk menganalisa bagian tertentu dari sebaran bersyarat. Pengujian hipotesis merupakan hal yang penting dalam tahapan analisis regresi. Pengujian hipotesis pada analisis regresi didasarkan pada asumsi error berdistribusi normal dengan π = 0 dan variansi π 2 dengan data yang berdistribusi simetris. Asumsi error tersebut umumnya tidak dipenuhi pada data kuantil atas yang berdistribusi tidak simetris. Berdasarkan asumsi tersebut penulis tertarik untuk membahas “Pengujian Hipotesis pada Regresi Kuantil”. Regresi Kuantil Misalnya π merupakan suatu variabel acak dengan suatu fungsi distribusi πΉπ dan π merupakan konstanta dimana 0 < π < 1. Kuantil ke- π dari πΉπ , dinotasikan sebagai ππ (π) merupakan solusi untuk πΉπ (π) = π, adalah sebagai berikut: ππ¦ (π) β πΉπ¦−1 (π) = inf{π¦ βΆ πΉπ (π¦) ≥ π}. Seperti halnya dengan suatu metode OLS yang digunakan sebagai meminimumkan jumlah kuadrat error (sisaan) untuk menentukan suatu nilai parameter π½, maka dalam analisis regresi kuantil, kuantil ke- π dari πΉπ dapat diperoleh dengan meminimumkan suatu fungsi berikut ini terhadap π: |π¦ − π|ππΉπ (π¦) + (1 − π) ∫ π∫ π¦>π = π∫ |π¦ − π|ππΉπ (π¦) π¦<π (π¦ − π)ππΉπ (π¦) − (1 − π) ∫ π¦>π (π¦ − π)ππΉπ (π¦). (1) π¦<π Dengan meminimumkan fungsi persamaan (1), dapat diperoleh persamaan berikut ini: 0 = −π ∫ ππΉπ (π¦) + (1 − π) ∫ π¦>π ππΉπ (π¦) π¦<π 0 = −π[1 − πΉπ (π)] + (1 − π)πΉπ (π) 0 = −π + πΉπ (π) sehingga diperoleh: π = πΉπ (π), sehingga persamaan (2) merupakan kuantil ke- π adalah solusi dari πΉπ . (2) Misalkan π sebagai suatu fungsi dari π yang telah diketahui, yang memiliki peluang yaitu πΉπ|π (π¦), maka kuantil ke- π dari fungsi tersebut dapat dituliskan −1 (π). ππ|π (π) ini merupakan suatu fungsi dari π dan dapat sebagai ππ|π (π) β πΉπ|π diselesaikan dengan persamaan berikut ini: min [π ∫ |π¦ − π|ππΉπ¦ (π¦) + (1 − π) ∫ |π¦ − π|ππΉπ¦ (π¦)]. π π¦>π (3) π¦<π Jika ππ|π (π) adalah fungsi linier πΏπ·, dengan vektor parameter π½ yang tidak diketahui, sehingga persamaan (3) menjadi: |π¦ − ππ½|ππΉπ (π¦) + (1 − π) ∫ min [π ∫ π½ π¦>ππ½ |π¦ − ππ½|ππΉπ (π¦)] . (4) π¦<ππ½ Solusi dari persamaan (4) ini dinotasikan sebagai π½0 dan kuantil π (sebagai fungsi dari π) ke- π adalah ππ|π (π) = ππ½0 (Kuan, 2007). ππ|π (π) = π₯π‘ π½ adalah kuantil ke-π (0 < π < 1) yang nilai π¦ tergantung terhadap π₯π‘ . Suatu nilai estimasi terhadap π½ dari regresi kuantil ke-π diperoleh dengan meminimumkan jumlah nilai mutlak dari error dengan pembobot π untuk error positif dan pembobot (1 − π) untuk error negatif adalah: π½Μ (π) = arg min {π ∑ |π¦π‘ − π₯π‘ π½| + (1 − π) ∑ |π¦π‘ − π₯π‘ π½|} π½ π‘:π¦π‘ ≥π₯π‘ (5) π‘:π¦π‘ <π₯π‘ atau π½Μ (π) = arg min ∑ π½ π ππ (π’π ) π=1 (6) untuk: ππ’π ππ (π’π ) = { (π − 1)π’π jika π’π ≥ 0 jika π’π < 0 Solusi dari persamaan (5) atau (6) tidak dapat diperoleh secara analitik, melainkan dikerjakan secara numerik, seperti metode simplex, metode interior point, atau metode smoothing. Pengujian Hipotesis Analisis regresi kuantil diterapkan pada sampel yang berukuran besar, maka parameter regresi kuantil menggunakan uji Wald. Asumsi hipotesis linier adalah πΉπ½π = π, dimana πΉ adalah matriks dengan full row rank berukuran π × π, dan π adalah vektor berukuran π × 1 pada nilai hipotesis. Rumusan hipotesis yang digunakan dalam penelitian ini adalah sebagai berikut: π»0 : π½ = 0 π»1 : π½ ≠ 0 A. Inferensi Asimtotik pada Regresi Kuantil Dalam regresi kuantil terdapat fungsi kuantil bersyarat ke-π yang mempertimbangkan estimasi π½(π), sehingga diperoleh solusi pada persamaan (6) atau dinyatakan pada persamaan (7): π½Μ (π) = arg min ∑ π½ π ππ (ππ − ππ π½). (7) π=1 Beberapa kondisi yang digunakan Newey dan McFadden (1994) terhadap teorema asimtotik normal sebagai berikut: π 1 −1 (8) ∑ ππ {1[ππ ≤ ππ½(π)] − π} + ππ (1) √π[π½Μ (π) − π½(π)] = π0 √π π=1 Berdasarkan persamaan (8) π0 adalah Hessian terhadap limit fungsi loss, dan 1 π π ∑ ππ {1[ππ ≤ ππ½(π)] − π} → π©(0, π0 ) √π π=1 dengan: π0 = πΈ({1[ππ ≤ ππ½(π)] − π}2 ππ ππ′ ) = π(1 − π)πΈ(π ′ ππ ). Perhatikan bahwa asumsi linier pada kuantil bersyarat adalah dinyatakan dalam persamaan (9) dan (10): π (9) √π[π½Μ (π) − π½(π)] → π©(0, π0 ) dimana: π(1 − π) [πΈ(ππ′ ππ )]−1 . π0 = (10) 2 −1 π(πΉ (π)) B. Menentukan Nilai Statistik Uji Μπ Uji Wald digunakan pada regresi kuantil untuk mengecek apakah πΉπ· signifikan terhadap hipotesis nilai π. Asumsi bahwa estimasi konsisten lemah untuk −1 (π)). Sehingga dari persamaan (7) diperoleh π(πΉ −1 (π)) dinotasikan dengan π(πΉΜ hipotesis nol seperti berikut ini: π΄ π(1 − π) Μ [πΈ(ππ′ ππ )]−1 ) √π[π½ (π) − π½(π)] ~ π© (0, 2 −1 π(πΉ (π)) −1 (π)) π(πΉ > 0 memiliki kepadatan positif dimana πΉ −1 (π) = π(π), dengan parameter skala π(1−π) π(πΉ−1 (π)) 2 menjadi fungsi π (π) = 1 π(πΉ −1 (π)) 2 yang disebut sebagai fungsi sparsity. Parzen (1979) menyatakan bahawa fungsi sparsity adalah fungsi kepadatan kuantil. Nilai π(πΉ −1 (π)) tidak diketahui dan harus diestimasi. Estimasi telah diusulkan Siddiqui (1960) dalam buku Davino dkk (2014) menyatakan bahwa: 1 π (π) = −1 π(πΉ (π)) (11) −1 (π πΉ + β) − πΉ −1 (π − β) = 2β Bandwidth β dari fungsi πΉ harus didefinisikan. Koenker dan Machado (1999) menyarankan menggunakan bandwidth: β= 1 1 2 1.5π 4 (Φ −1 (π)) 3 π −3 π 3 [ ] (2Φ−1 (π)2 + 1) (12) Berdasarkan teorema Slutsky dan sifat distribusi normal, mengalikan πΉ pada distribusi maka diperoleh: π΄ Μ Μ (π) πΉ√π[π½ − π½(π)] = √π(πΉπ½(π) − π) ~ π©(0, πΉπΎπ πΉ′ ). Dengan hukum bilangan besar lemah, ππ = π−1 ∑ππ=1 π′π ππ konsisten terhadap πΈ(ππ′ ππ ). Estimasi konsisten lemah untuk π0 adalah: π(1 − π) Μ0 = [ππ ]−1 π 2 −1 π(πΉ (π)) atau: Μ0 = π π(1 − π) π(πΉ −1 (π)) π 2 [π −1 −1 ∑ π′π ππ ] π=1 (13) sehingga: 1 π΄ − 2 Μ Μ Γπ √π(πΉπ½(π) − π) ~ π©(0, π°π ) 1 Μ π πΉ′ . dimana ΓΜ −2 = πΉπΎ 1 Μ π − π) merupakan vektor berdistribusi normal. Hasil kali dalam ΓΜ −2 (πΉπ· antara vektor tersebut sehingga diperoleh statistik uji Wald berikut ini: π΄ 1 Μ π − π)′ ΓΜ −2 (πΉπ· Μ π − π) ~ π 2 (π) (14) π²π (π) = π(πΉπ· C. Kriteria Penerimaan dan Penolakan π»0 Jika nilai π²π (π) ≥ nilai tabel chi-square maka π»0 ditolak Jika nilai π²π (π) < nilai tabel chi-square maka π»0 tidak ditolak Aplikasi Pengujian Hipotesis Pada Regresi Kuantil Data yang digunakan berupa data curah hujan bulanan dan Sea Surface Temperature (SST) Niño 3.4. Data curah hujan diperoleh dari BMKG Maros yaitu data curah hujan Stasiun Meteorologi Hasanuddin Makassar periode Januari 1983September 2015. Data SST Niño 3.4 diperoleh dari internet http://www.esrl.noaa.gov/psd/gcos_wgsp/Timeseries/Nino34/. Program komputer yang digunakan untuk mendukung proses penelitian ini adalah program RStudio. Berdasarkan fungsi kuantil π ∈ [0.1] dapat didekati dalam bentuk fungsi distribusi empiris. Grafik fungsi distribusi empiris adalah sebagai berikut: Gambar (a) Fungsi Distribusi Empiris πΉπ¦ (π) Gambar (b) Fungsi Distribusi Empiris ππ (π) Berdasarkan gambar (b) dapat disimpulkan bahwa ππ (0.75) = 405, yang berarti pada data curah hujan nilai kuantil 0.75 berada disekitaran 405, kuantil 0.80 berada disekitaran 493, kuantil 0.85 berada disekitaran 552, kuantil 0.90 berada disekitaran 687, dan kuantil 0.95 berada disekitaran 863. Tabel 1.1 Hasil estimasi parameter regresi kuantil Kuantil 0.75 0.80 0.85 0.90 0.95 Sumber: hasil olah data Intercept (π½0 ) 403.8846 481.7586 533.6131 643.8378 824.8028 Kemiringan (π½1 ) −113.4615 −117.2414 −98.0926 −121.6216 −64.6789 Nilai estimasi parameter π½0 berbanding lurus dengan kuantil dalam hal ini semakin besar kuantil yang dipilih, maka nilai estimasi parameter π½0 meningkat. Persamaan regresi untuk kuantil 75%, 80%, 85%, 90%, dan 95% adalah sebagai berikut: π75% = 403.8846 − 113.4615π π80% = 481.7586 − 117.2414π π85% = 533.6131 − 98.0926π π90% = 643.8378 − 121.6216π π95% = 824.8028 − 64.6789π Selang kepercayaan estimasi parameter π½0 dan π½1 menggunakan πΌ = 0.05 untuk kelima kuantil atas adalah sebagai berikut: Tabel 1. 2 Selang kepercayaan terhadap estimasi parameter Kuantil π½0 75% 354.8393 − 451.5338 80% 430.1285 − 522.6401 85% 512.1712 − 610.0504 90% 609.2118 − 739.2684 95% 772.1026 − 917.2122 Sumber: hasil olah data π½1 −144.9374 − (−55.1881) −145.5004 − (−77.0079) −151.6838 − (−76.6799) −146.3982 − (−68.4706) −175.0718 − 7.7018 Gambar (c) Plot estimasi parameter regresi kuanti pada kuantil atas Nilai bandwidth berdasarkan pada persamaan (12) adalah: Tabel 1. 3 Nilai bandwidth berdasarkan data menggunakan program RStudio. Kuantil 0.75 β 0.0919 Sumber: hasil olah data 0.80 0.0781 0.85 0.0633 0.90 0.0472 0.95 0.0290 Nilai fungsi sparsity berdasarkan persamaan (4.10) pada kuantil 0.75, 0.80, 0.85, 0.90, dan 0.95 adalah sebagai berikut: Kuantil 0.75 adalah 7.4715 × 10−4 Kuantil 0.80 adalah 5.6522 × 10−4 Kuantil 0.85 adalah 4.6520 × 10−4 Kuantil 0.90 adalah 3.2218 × 10−4 Kuantil 0.95 adalah 2.1887 × 10−4 Μ0 pada kuantil Berdasarkan persamaan (13) nilai estimasi konsisten lemah untuk π 0.75, 0.80, 0.85, 0.90, dan 0.95 adalah sebagai berikut: 330005.1055 Kuantil 0.75 adalah [ 13200.2042 13200.2042 ] 435606.7392 492064.9827 Kuantil 0.80 adalah [ 19682.5993 19682.5993 ] 649525.7771 578849.1751 Kuantil 0.85 adalah [ 23153.9670 23153.9670 ] 764080.9112 851878.6127 Kuantil 0.90 adalah [ 34075.1445 34075.1445 ] 1124479.7688 974214.0531 Kuantil 0.95 adalah [ 38968.5621 38968.5621 ] 1285962.5501 Menentukan nilai statistik uji pada regresi kuantil menggunakan uji Wald berdasarkan persamaan (14) maka nilai uji Wald pada kuantil 0.75, 0.80, 0.85, 0.90, 0.95 adalah sebagai berikut: π²99 (0.75) = 5.7647 × 1012 π²79 (0.80) = 9.5518 × 1012 π²59 (0.85) = 1.0015 × 1013 π²39 (0.90) = 1.4213 × 1013 π²20 (0.95) = 1.3280 × 1013 Penerimaan dan Penolakan π»0 π²99 (0.75) ≥ π 2 (99) atau 5.7647 × 1012 ≥ 123.2252 π²79 (0.80) ≥ π 2 (79) atau 9.5518 × 1012 ≥ 100.7486 π²59 (0.85) ≥ π 2 (59) atau 1.0015 × 1013 ≥ 77.9305 π²39 (0.90) ≥ π 2 (39) atau 1.4213 × 1013 ≥ 54.5722 π²20 (0.95) ≥ π 2 (20) atau 1.3280 × 1013 ≥ 31.4104 Kesimpulan Untuk mendapatkan statistik uji Wald perlu ditunjukkan bahwa distribusi asimtotik estimator berdistribusi normal (0, π0 ). Dari distribusi asimtotik tersebut diperoleh fungsi sparsity. Rumusan fungsi sparsity digunakan untuk mengkonstruksi statistik uji Wald yang berdistribusi chi-square dengan derajat bebas π. Pengaplikasian pengujian hipotesis pada regresi kuantil menunjukkan bahwa SST Niño 3.4 memberi pengaruh yang signifikan terhadap curah hujan ekstrem di Kota Makassar. Daftar Pustaka Davino, C., Furno, M., & Vistocco, D. (2014). Quantile Regression Theory and Applications. Wiley. Koenker, R., & Bassett, Jr., G. (1978). Regression quantile. Econometrica. 46; 3350. Kuan, C.-M. (2007). An Introduction To Quantile Regression. Econometrica. Institute of Economics, Academia Sinica. Navianti, D. R. (2014). Regresi Kuantil Untuk Pemodelan Tingkat Pengangguran Terbuka di Indonesia. In Skripsi. Institut Teknologi Sepuluh Nopember. Newey, W., & McFadden, D. (1994). Large Sample Estimation and Hypothesis Testing, in R. Rahmawati, R., Widiarti, & Novianti, P. (2011). Regresi Kuantil (Studi Kasus Pada Suhu Harian).