BAB I PENDAHULUAN 1.1 Latar belakang dan permasalahan Analisis regresi dapat digunakan untuk mengetahui hubungan antara variabel yang dipengaruhi (Y) atau yang biasa disebut variabel respon dan variabel prediktor (X) atau variabel yang mempengaruhi. Regresi logistik merupakan model regresi yang digunakan bila variabel responnya (Y) bersifat kualitatif (Hosmer dan Lemeshow, 1989). Regresi logistik terbagi menjadi tiga, yaitu regresi logistik biner (ganda), nominal, dan ordinal. Regresi logistik biner digunakan ketika variabel respon memiliki dua kategori, biasanya kategori iya dan tidak, regresi logistik nominal digunakan bila variabel respon mempunyai lebih dari dua kategori, sedangkan regresi logistik ordinal hampir sama dengan regresi logistik nominal namun variabel responnya didasarkan pada urutan (ordinal). Dalam skripsi ini analisis yang digunakan adalah analisis regresi logistik biner. Pada proses pemilihan model regresi logistik biner terbaik diperlukan pendeteksiaan terhadap data pencilan (outlier) karena keberadaannya dalam data dapat mempengaruhi kesimpulan akhir dari model terpilih tersebut. Outlier adalah pengamatan yang jauh dari pusat data yang mungkin berpengaruh besar terhadap koefisien regresi (Sembiring, 2003). Oleh karena itu diperlukan suatu metode analisis regresi logistik biner yang kekar (robust) terhadap outlier sehingga akan menghasilkan kesimpulan yang lebih akurat. Metode yang akan dibahas dalam skripsi ini adalah estimator Bianco-Yohai yang merupakan penaksir parameter yang baik dalam menghadapi data pencilan. 1.2 Tujuan dan manfaat penulisan Tujuan dari penulisan tugas akhir ini antara lain: 1. Menyajikan suatu teknik statistika pembentukan model regresi logistik biner terbaik menggunakan estimator Bianco-Yohai. 1 2 2. Menunjukan perbandingan antara model regresi logistik biner dan metode estimasi Bianco-Yohai berdasarkan nilai MSE dan R2. 3. Mengaplikasikan metode regresi logistik biner dengan estimator Bianco-Yohai pada data real yang mengandung outlier. 4. Menyajikan persamaan model akhir yang terbentuk berdasarkan contoh studi kasus yang digunakan. Manfaat dari penulisan ini antara lain: 1. Dapat memperoleh estimasi dari parameter regresi logistik menggunakan metode yang berbeda dari yang biasa dilakukan yakni menggunakan metode estimasi Bianco-Yohai yang robust terhadap outlier. 2. Memperluas wawasan mengenai aplikasi statistika khususnya dalam bentuk regresi logistik dimana regresi logistik sangat besar peranannya dalam berbagai penelitian baik di bidang kesehatan, ekonomi, industri, dan lain-lain. 3. Dapat menentukan probabilitas dari suatu kasus regresi logistik dimana data variabel responnya bersifat biner yang selanjutnya dapat digunakan untuk mengambil suatu keputusan. 4. Menambah ilmu pengetahuan yang kemudian dapat dikembangkan ke tingkat yang lebih lanjut. 1.3 Batasan masalah Agar tidak terjadi penyimpangan dari tujuan semula dan pemecahan masalah lebih terfokus, maka pembahasan skripsi ini akan difokuskan pada pembentukan model regresi logistik biner biasa dan pembentukan model regresi logistik biner menggunakan estimasi Bianco-Yohai agar dapat memprediksi probabilitas terjadinya (atau tidak terjadinya) suatu peristiwa yang menjadi event berdasarkan nilai-nilai prediktor yang ada. Data yang akan diolah harus memiliki data pencilan. 3 1.4 Tinjauan pustaka Pembahasan mengenai pembentukan model regresi logistik robust dengan estimasi Bianco-Yohai telah diperkenalkan oleh Bianco dan Yohai pada tahun 1996. Jurnal meraka yang berjudul “Regresi Logistik Robust dengan Estimator Bianco-Yohai” menjadi tinjauan pustaka utama dalam skripsi ini. Dalam jurnal tersebut mereka membuktikan bahwa model regresi logistik robust kekar terhadap data pencilan sehingga menghasilkan estimasi yang lebih akurat dibandingkan dengan model regresi logistik biner biasa. Hauser dan Booth (2011) melakukan penelitian terhadap faktor-faktor yang mempengaruhi iya tidaknya seorang CEO memperoleh bonus. Mereka menggunakan metode estimasi Bianco-Yohai dan menyimpulkan bahwa hasil estimasi dari metode regresi logistik biasa (dengan mengeluarkan outlier) akan mendekati hasil dari estimasti Bianco-Yohai sehingga menurut penelitian tersebut estimasi Bianco-Yohai kekar terhadap data pencilan. Peneliti lainnya yang pernah membahas tentang estimasi Bianco-Yohai adalah Croux dan Haesbroeck (2003) serta Lendri Casiawaty (2015). 1.5 Metodologi penulisan Metodologi penulisan yang digunakan dalam tugas akhir ini merupakan studi literatur dan analisis data dengan menggunakan paket program R, Excel dan SPSS. Sumber penulisan yang digunakan dalam penyusunan tugas akhir ini bersumber dari buku yang terkait dengan tema skripsi, jurnal, serta sumber-sumber lain yang diperoleh melalui internet. 1.6 Sistematika penulisan Skripsi ini disusun dengan sistematika penulisan sebagai berikut: BAB I PENDAHULUAN Bagian ini membahas mengenai pendahuluan dari tema yang diangkat dalam skripsi ini, meliputi: latar belakang dan permasalahan tema, tujuan dan manfaat penulisan, tinjauan pustaka, metodologi penulisan, dan sistematika penulisan. 4 BAB II LANDASAN TEORI Bagian ini membahas mengenai teori-teori dasar yang terkait dan menunjang atau diperlukan dalam pemecahan masalah seputar “Regresi Logistik Robust dengan Estimator Bianco-Yohai”. BAB III PEMBAHASAN Pada bab ini akan dibahas mengenai konsep umum model regresi logistik dengan MLE dan iterasi Newton Raphson, regresi robust, regresi logistik dengan estimasi Bianco-Yohai dengan iterasi Newton-Raphson. BAB IV STUDI KASUS Bagian ini membahas mengenai aplikasi model regresi logistik biner biasa, model regresi logistik dengan estimasi Bianco-Yohai, pendeteksian adanya outlier pada data real dan perbandingan antara model regresi logistik dengan MLE dan model estimasi BiancoYohai. BAB V PENUTUP Bagian ini membahas kesimpulan yang didapat dari hasil pembahasan pada bab-bab sebelumnya dan memberikan saran untuk perkembangan tema skripsi ini pada perkembangan ilmu statistika secara umumnya. khususnya dalam