BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Terdapat beberapa analisis data dalam statistik, salah satunya adalah statistika inferensi. Statistika inferensi mempelajari salah satu metode untuk menentukan hubungan sebab akibat antara variabel satu dengan variabel yang lain. Metode ini disebut analisis regresi, analisis regresi adalah salah satu analisis yang dipakai secara luas untuk melakukan prediksi dan ramalan. Analisis ini merupakan ilmu yang mempelajari tentang suatu hubungan fungsional antara variabel-variabel yang dinyatakan dalam suatu bentuk persamaan matematik. Analisis regresi dapat digunakan untuk mengetahui hubungan antara variabel respon yang dinotasikan dengan variabel Y dengan variabel prediktor yang dinotasikan dengan variabel X. Pada umumnya, analisis regresi sering menggunakan data kuantitatif sebagai peubah responnya. Akan tetapi dalam kenyataannya banyak ditemukan kasus dengan peubah responnya berupa data kualitatif yang berbentuk biner, misalnya jenis kelamin (laki-laki atau perempuan) dan pengambilan keputusan (ya atau tidak). Dalam analisis regresi hubungan antara peubah respon bersifat kualitatif, sedangkan peubah prediktornya bisa bersifat kuantitatif, akan tetapi kualitatif atau gabungan keduanya dapat digambarkan kedalam suatu model yang dikenal sebagai model respon biner. Salah satu bagian dari analisis regresi yang mempunyai model respon bersifat biner adalah analisis regresi logistik. Regresi logistik terbagi menjadi tiga, yaitu regresi logistik biner, nominal, dan ordinal. Analisis regresi logistik digunakan untuk mengetahui pengaruh suatu peubah prediktor terhadap peubah respon. Parameter model regresi logistik diduga dengan metode Maximum Likelihood Estimation (MLE) dan untuk perhitungannya biasanya digunakan metode iterasi Newton Raphson. Namun metode Maximum Likelihood Estimation (MLE) tidak dapat digunakan jika terdapat kasus pemisahan. Kehadiran kasus pemisahan disebabkan data yang mempunyai sampel 1 2 kecil sehingga mengakibatkan bias pada estimasi parameter metode Maximum Likelihood Estimation (MLE). Kasus seperti ini dalam bidang statistika disebut dengan kasus pemisahan (Albert dan Anderson,1984). Masalah pemisahan perlu diselesaikan karena mengakibatkan nilai estimasi parameter pada regresi logistik tidak mendekati nilai estimasi parameter yang sebenernya. Estimasi parameter regresi logistik biner tidak dapat dilakukan dengan metode Maximum Likelihood Estimation (MLE) apabila terdapat kasus pemisahan. Untuk menyelesaikan hal tersebut, digunakan pendekatan metode Penalized Maximum Likelihood Estimation (PMLE) yang pertama kali diusulkan oleh Firth (1993). Penalized Maximum Likelihood Estimation (PMLE) merupakan hasil modifikasi fungsi skor likelihood menjadi fungsi Penalized likelihood. Metode ini terbukti memberikan solusi ideal untuk menyelesaikan penduga yang tidak konvergen. Pada skripsi ini, akan dibahas masalah untuk mengatasi kasus pemisahan kurang sempurna (quasi complete separation) dengan menerapkan metode Penalized Maximum Likelihood Estimation (PMLE) pada regresi logistik biner. 1.2 Pembatasan Masalah Untuk membatasi permasalahan pada skripsi ini, asumsi regresi logitik biner dianggap terpenuhi dan variabel respon pada data yang digunakan pada regresi kali ini bersifat biner. Agar tidak menyimpang dari tujuan semula dan masalah lebih berfokus, maka pembahasan skripsi ini akan difokuskan pada pembentukan model regresi logistik biner dengan masalah adanya pemisahan yaitu kasus quasi complete separation dengan metode Penalized Maximum Likelihood Estimation (PMLE). 1.3 Tujuan Penulisan Berdasarkan latar belakang permasalahn yang sudah dipaparkan diatas, maka tujuan dari skripsi ini, yaitu : 1. Mengatasi kasus pemisahan kurang sempurna (quasi complete separation) pada metode Maximum Likelihood Estimation (MLE) 3 2. Mendapatkan model terbaik pada data yang akan dianalisis dengan mengaplikasikan metode Penalized Maximum Likelihood Estimation. 3. Menganalisis faktor-faktor yang mempengaruhi pemberian kredit dari dinas peternakan kepada peternak ayam potong di kecamatan ungaran jawa tengah dengan metode PMLE. 1.4 Tinjauan Pustaka Dalam skripsi ini, penulis menggunakan berbagi sumber pustaka untuk dijadikan inspirasi dalam penulisan penelitian. Albert dan Anderson (1984) dalam jurnalnya“On the Existence of Maximum Likelihood Estimates in Logistic Regression Models” menyatakan bahwa ketika terdapat hiperplane H pada ruang kovariat yang menyebabkan terdapatnya titik-titik sampel dengan terletak pada satu sisi sajadan titik-titik sampel dengan = 0 hanya terletak di sisi lainnya, maka akan terjadi kasus pemisahan. Kasus pemisahan dapat diklasifikasikan menjadi dua yaitu complete separation dan quasi complete separation. Firth (1993) dalam jurnalnya “Bias Reduction of Maximum Likelihood Estimates”mengenalkan metode penalized dengan Invarian Jeffreysprior yang bertujuan untuk menghilangkan bias pada MLE. Heinze dan Schemper (2002) menyatakan bahwa estimasi parameter dengan metode Penalized Maximum Likelihood menggunakan teknik iterasi. Untuk Estimasi parameter Estimation (PMLE) menggunakan metode iterasi Newton Raphson, dimana nilai awal untuk parameter adalah r = 0. Proses iterasi dengan menggunakan metode Newton Raphson akan dilakukan terus menerus hingga didapatkan nilai ̂ , jika nilai ̂ ̂ maka diperoleh nilai yang konvergen sehingga proses iterasi berhenti jika kriteria kekonvergenan telah terpenuhi. 1.5 Metode Penelitian Metodologi penelitian yang digunakan dalam tugas akhir ini merupakan studi literatur dan analisis data dengan menggunakan paket program R dan Excel. 4 Sumber penulisan yang digunakan dalam penyusunan skripsi ini bersumber dari buku-buku diperpustakaan dan referensi dari sumber-sumber lain yang diperoleh melalui internet serta dari referensi yang terkait dengan tema skripsi dan jurnal. 1.6 Sistematika Penulisan Sistematika penulisan pada skripsi ini disusun sebagai berikut : BAB I PENDAHULUAN Pada bab ini membahas mengenai pendahuluan dari tema yang diangkat dalam skripsi ini, meliputi :latar belakang dan permasalahan tema, tujuan dan manfaat penulisan, tinjauan pustaka, metodologi penulisan, dan sistematika penulisan. BAB II LANDASAN TEORI Pada bab ini membahas mengenai teori-teori dasar yang terkait dan menunjang atau diperlukan dalam pemecahan masalah “Estimasi Parameter Model Regresi Logistik Biner menggunakan Metode Penalized Maximum Likelihood (PML)” BAB III PEMBAHASAN Pada bab ini akan dibahas mengenai konsep umum model regresi logistik dengan MLE dan iterasi Newton Raphson, dan regresi logistik biner dengan metode Penalized Maximum Likelihood Estimation (PMLE)” BAB IV STUDI KASUS Pada bab ini membahas mengenai aplikasi model regresi logistik biner, model regresi logistik biner dengan metode Penalized Maximum Likelihood Estimation (PMLE) danpendeteksian adanya kasus data yang terpisah secara kurang sempurna (quasi complete separation). BAB V PENUTUP Pada bab ini membahas kesimpulan yang didapat dari hasil pembahasan pada bab-bab sebelumnya dan memberikan saran 5 untuk perkembangan tema skripsi ini pada khususnya dalam perkembangan ilmu statistika secara umumnya.