BAB III METODOLOGI ANALISIS

advertisement
BAB III
METODOLOGI ANALISIS
3.1 Analisis Permasalahan
Analisis metode bootsrap pada regresi logistik yang dibandingkan dengan regresi
logistik biasa dapat dilakukan dengan cara menganalisis keakuratan regresi logistik dan
regresi logistik dengan metode bootstrap tersebut .
Karena pada regresi logistik perbedaan estimasi antara Y dan Ŷ dihitung
menggunakan deviance residual, maka untuk mengetahui bagaimanakah keakuratan
metode bootstrap pada regresi logistik dapat dianalisis dengan membandingkan
perbedaan deviance residual antara regresi logistik dan regresi logistik dengan metode
bootstrap.
Jika didapatkan hasil yang besar dari perbedaan deviance residual antara kedua
regresi tersebut, maka penggunaan metode bootstrap probabilitas bersyarat pada regresi
logistik dapat dikatakan kurang tepat, karena mempunyai kekakuratan yang buruk.
3.2 Teknik Pembangkitan Data
Seperti yang telah dijelaskan pada regresi logistik berganda mempunyai variabel
dependen (Y) yang berdistribusi binomial dan mempunyai lebih dari satu variabel
independen (X) yang dapat terdiri dari variabel yang continu, diskrit, dikotomus, ataupun
gabungannya. Akan tetapi didalam penulisan saya ini, saya akan melakukan
penganalisisan terhadap data variabel independen X yang secara keseluruhan mempunyai
distribusi normal yang bernilai acak.
22
Jumlah data dan jumlah variabel dependen yang akan dibangkitkan berbeda-beda
agar dapat terlihat dengan jelas perbedaanya. Macam-macam variabel dan jumlah
datanya yang akan dibangkitkan adalah:
1. 3 independen dan 1 dependen dengan masing-masing 30 data.
2. 3 independen dan 1 dependen dengan masing-masing 60 data.
3. 3 independen dan 1 dependen dengan masing-masing 100 data
2. 3 independen dan 1 dependen dengan masing-masing 500 data
2. 6 independen dan 1 dependen dengan masing-masing 30 data
4. 6 independen dan 1 dependen dengan masing-masing 60 data
5. 6 independen dan 1 dependen dengan masing-masing 100 data.
6. 6 independen dan 1 dependen dengan masing-masing 500 data.
3.3 Teknik Bootstrap Data
Metode bootstrap yang digunakan pada penulisan ini adalah metode bootstrap
conditional distribution, maka setelah data dibangkitkan harus dipilih dengan nilai
probabilitas μ i yang merupakan conditional expected value yang berisikan probabilitas
P(Y*=1) untuk variabel dependen regresi logistik bootstrap (Y*).
Setelah dididapatkan μ i sebanyak satu kelompok data, nilai μ i tersebut digunakan
untuk menentukan nilai Y* yang baru. Y* tersebut kemudian akan menjadi data dari
variabel dependen hasil dari bootstrap. Hal ini berlangsung selama 1000 kali.
Setelah direplikasi bootstrap sebanyak 1000 kali maka langkah selanjutnya adalah
mengestimasi parameter dari regresi logistik bootstrap dengan data dari variabel X yang
sama dan menggunakan variabel Y* hasil dari bootstrap. Estimasi parameter dilakukan
23
pada setiap kelompok data, jadi karena bootstrapping dilakukan sebanyak 1000 kali maka
akan terdapat 1000 macam persamaan regresi logistik.
3.4 Tahapan Analisis
Terdapat beberapa tahapan penelitian yang dilalui dalam penulisan skripsi
ini, yaitu :
1. Pencarian Landasan Teori
Pada tahap ini dilakukan studi yang bersumber dari buku, artikel, jurnal,
website mengenai beberapa teori yang dapat digunakan dalam analisis seperti
teori dan contoh-contoh multiple logistic regression, metode Newton-Rhapson ,
metode bootrap, conditional probability distribution, dan lain-lain.
2. Analisis Masalah
Berdasarkan dari landasan teori yang telah diperoleh, peneliti selanjutnya
melakukan analisis terhadap masalah yang ada dan bagimanakah saya akan
mengatasinya. Pada tahap ini dilakukan perencanaan mengenai prosedur-prosedur
apa saja yang diperlukan dalam menganalisis pemakaian metode bootstrap dan
regresi logistik.
3. Perancangan Program
Perancangan program merupakan tahap dimana hasil dari analisis yang
peneliti lakukan diimplementasikan kedalam program yang akan dirancang di RLanguage untuk mempermudah analisis, sehingga data tidak perlu dianalisis
secara manual. Selain itu program dirancang agar dapat menghitung deviance
residual pada masing-masing regresi logistik biasa dan regresi logistik dengan
bootstrap.
24
4. Penulisan Penelitian
Dari hasil yang didapat, peneliti dapat menuliskan pada penelitiannya ini
dan akan menyimpulkannya hasilnya.
3.5 Teknik Analisis
Seperti yang diketahui untuk menganalisis regresi logistik biasa dan regresi logistik
dengan metode bootstrap dapat dilakukan dengan cara membandingkan nilai deviance
residual antara kedua regresi tersebut dari data yang sudah diestimasi parameternya
dengan data observasi yang sama.
Maka langkah pertama yang harus dilakukan adalah mengestimasi parameter dari
regresi logsitik biasa dan regresi logistik dengan metode bootstrap. Untuk menemukan
koefisien dari regresi logistik seperti yang diketahui dengan menggunakan metode IRLS,
maka regresi logistik baik dengan data observasi maupun dengan data replikasi bootstrap
diestimasi masing-masing parameternya menggunakan metode yang sama akan tetapi
karena pada regresi logistik dengan metode bootstrap terdapat 1000 replikasi, maka
estimasi parameter dilakukan 1000 kali sesuai dengan jumlah replikasinya.
Setelah didapatkan 1000 macam estimasi parameter pada regresi logistik dengan
bootstrap, hal selanjutnya yang harus dilakukan adalah mendapatkan nilai estimasi
parameter rata-ratanya sehingga dapat dibandingkan dengan estimasi parameter dari
regresi logistik biasa.
Karena diperlukan perbandingan antara rata-rata dari seluruh deviance residual
replikasi bootstrap dengan regresi logistik biasa, maka langkah selanjutnya adalah
∧
∧
∧
mendapatkan nilai D *( • ). D *( • ) harus berasal dari jumlah seluruh nilai D *(b) yang
25
seluruhnya terdapat 1000 macam dan berasal dari 1000 persamaan regresi logistik
bootstrap, dibagi dengan 1000 (jumlah replikasi bootsrap).
Perbandingan deviance residual pada regresi logistik biasa dan regresi logistik
dengan metode bootstrap dilakukan pada berbagai jumlah data (30,60,100,500) dan
jumlah variabel independen (3 dan 6) agar didapat analisis yang akurat perbedaan yang
didapat dari penelitian ini.
Berbagai perhitungan, bootstrapping, dan penyajian data dilakukan menggunakan
R-Language. Penggunaan R-Language juga digunakan untuk mepermudah, juga
mempercepat penganalisisan hasilnya dalam pembuatan penulisan ini.
Download