BAB III METODOLOGI ANALISIS 3.1 Analisis Permasalahan Analisis metode bootsrap pada regresi logistik yang dibandingkan dengan regresi logistik biasa dapat dilakukan dengan cara menganalisis keakuratan regresi logistik dan regresi logistik dengan metode bootstrap tersebut . Karena pada regresi logistik perbedaan estimasi antara Y dan Ŷ dihitung menggunakan deviance residual, maka untuk mengetahui bagaimanakah keakuratan metode bootstrap pada regresi logistik dapat dianalisis dengan membandingkan perbedaan deviance residual antara regresi logistik dan regresi logistik dengan metode bootstrap. Jika didapatkan hasil yang besar dari perbedaan deviance residual antara kedua regresi tersebut, maka penggunaan metode bootstrap probabilitas bersyarat pada regresi logistik dapat dikatakan kurang tepat, karena mempunyai kekakuratan yang buruk. 3.2 Teknik Pembangkitan Data Seperti yang telah dijelaskan pada regresi logistik berganda mempunyai variabel dependen (Y) yang berdistribusi binomial dan mempunyai lebih dari satu variabel independen (X) yang dapat terdiri dari variabel yang continu, diskrit, dikotomus, ataupun gabungannya. Akan tetapi didalam penulisan saya ini, saya akan melakukan penganalisisan terhadap data variabel independen X yang secara keseluruhan mempunyai distribusi normal yang bernilai acak. 22 Jumlah data dan jumlah variabel dependen yang akan dibangkitkan berbeda-beda agar dapat terlihat dengan jelas perbedaanya. Macam-macam variabel dan jumlah datanya yang akan dibangkitkan adalah: 1. 3 independen dan 1 dependen dengan masing-masing 30 data. 2. 3 independen dan 1 dependen dengan masing-masing 60 data. 3. 3 independen dan 1 dependen dengan masing-masing 100 data 2. 3 independen dan 1 dependen dengan masing-masing 500 data 2. 6 independen dan 1 dependen dengan masing-masing 30 data 4. 6 independen dan 1 dependen dengan masing-masing 60 data 5. 6 independen dan 1 dependen dengan masing-masing 100 data. 6. 6 independen dan 1 dependen dengan masing-masing 500 data. 3.3 Teknik Bootstrap Data Metode bootstrap yang digunakan pada penulisan ini adalah metode bootstrap conditional distribution, maka setelah data dibangkitkan harus dipilih dengan nilai probabilitas μ i yang merupakan conditional expected value yang berisikan probabilitas P(Y*=1) untuk variabel dependen regresi logistik bootstrap (Y*). Setelah dididapatkan μ i sebanyak satu kelompok data, nilai μ i tersebut digunakan untuk menentukan nilai Y* yang baru. Y* tersebut kemudian akan menjadi data dari variabel dependen hasil dari bootstrap. Hal ini berlangsung selama 1000 kali. Setelah direplikasi bootstrap sebanyak 1000 kali maka langkah selanjutnya adalah mengestimasi parameter dari regresi logistik bootstrap dengan data dari variabel X yang sama dan menggunakan variabel Y* hasil dari bootstrap. Estimasi parameter dilakukan 23 pada setiap kelompok data, jadi karena bootstrapping dilakukan sebanyak 1000 kali maka akan terdapat 1000 macam persamaan regresi logistik. 3.4 Tahapan Analisis Terdapat beberapa tahapan penelitian yang dilalui dalam penulisan skripsi ini, yaitu : 1. Pencarian Landasan Teori Pada tahap ini dilakukan studi yang bersumber dari buku, artikel, jurnal, website mengenai beberapa teori yang dapat digunakan dalam analisis seperti teori dan contoh-contoh multiple logistic regression, metode Newton-Rhapson , metode bootrap, conditional probability distribution, dan lain-lain. 2. Analisis Masalah Berdasarkan dari landasan teori yang telah diperoleh, peneliti selanjutnya melakukan analisis terhadap masalah yang ada dan bagimanakah saya akan mengatasinya. Pada tahap ini dilakukan perencanaan mengenai prosedur-prosedur apa saja yang diperlukan dalam menganalisis pemakaian metode bootstrap dan regresi logistik. 3. Perancangan Program Perancangan program merupakan tahap dimana hasil dari analisis yang peneliti lakukan diimplementasikan kedalam program yang akan dirancang di RLanguage untuk mempermudah analisis, sehingga data tidak perlu dianalisis secara manual. Selain itu program dirancang agar dapat menghitung deviance residual pada masing-masing regresi logistik biasa dan regresi logistik dengan bootstrap. 24 4. Penulisan Penelitian Dari hasil yang didapat, peneliti dapat menuliskan pada penelitiannya ini dan akan menyimpulkannya hasilnya. 3.5 Teknik Analisis Seperti yang diketahui untuk menganalisis regresi logistik biasa dan regresi logistik dengan metode bootstrap dapat dilakukan dengan cara membandingkan nilai deviance residual antara kedua regresi tersebut dari data yang sudah diestimasi parameternya dengan data observasi yang sama. Maka langkah pertama yang harus dilakukan adalah mengestimasi parameter dari regresi logsitik biasa dan regresi logistik dengan metode bootstrap. Untuk menemukan koefisien dari regresi logistik seperti yang diketahui dengan menggunakan metode IRLS, maka regresi logistik baik dengan data observasi maupun dengan data replikasi bootstrap diestimasi masing-masing parameternya menggunakan metode yang sama akan tetapi karena pada regresi logistik dengan metode bootstrap terdapat 1000 replikasi, maka estimasi parameter dilakukan 1000 kali sesuai dengan jumlah replikasinya. Setelah didapatkan 1000 macam estimasi parameter pada regresi logistik dengan bootstrap, hal selanjutnya yang harus dilakukan adalah mendapatkan nilai estimasi parameter rata-ratanya sehingga dapat dibandingkan dengan estimasi parameter dari regresi logistik biasa. Karena diperlukan perbandingan antara rata-rata dari seluruh deviance residual replikasi bootstrap dengan regresi logistik biasa, maka langkah selanjutnya adalah ∧ ∧ ∧ mendapatkan nilai D *( • ). D *( • ) harus berasal dari jumlah seluruh nilai D *(b) yang 25 seluruhnya terdapat 1000 macam dan berasal dari 1000 persamaan regresi logistik bootstrap, dibagi dengan 1000 (jumlah replikasi bootsrap). Perbandingan deviance residual pada regresi logistik biasa dan regresi logistik dengan metode bootstrap dilakukan pada berbagai jumlah data (30,60,100,500) dan jumlah variabel independen (3 dan 6) agar didapat analisis yang akurat perbedaan yang didapat dari penelitian ini. Berbagai perhitungan, bootstrapping, dan penyajian data dilakukan menggunakan R-Language. Penggunaan R-Language juga digunakan untuk mepermudah, juga mempercepat penganalisisan hasilnya dalam pembuatan penulisan ini.