presentation name - Eni Sumarminingsih

advertisement
ANALISIS DATA KATEGORI
Eni Sumarminingsih
Distribusi Multinomial
• Misalnya terdapat c kategori pada
variabel respon. Peluangnya
dinotasikan {1 ,2 ,…,c} di mana
𝑗 𝑗 = 1.
• Untuk n sampel, peluang
Multinomial bahwa n1 jatuh pada
kategori1, n2 jatuh pada kategori
2,…, nc jatuh pada kategori c di
mana 𝑗 𝑛𝑗 = 𝑛
Distribusi Multinomial
Regresi Logistik
Multinomial
Regresi Logistik yang melibatkan
variabel respon dengan kategori lebih
dari dua dengan skala nominal yaitu
tidak memiliki tingkatan serta
variabel prediktor yang bersifat
kategori dan atau kontinyu disebut
sebagai regresi logistik multinomial
Suatu variabel respon dengan M kategori
akan membentuk persamaan logit
sebanyak M-1 di mana masing-masing
persamaan ini membentuk regresi logistik
biner yang membandingkan suatu
kelompok kategori terhadap kategori
pembanding
Secara umum model multinomial logit
adalah
Jika yang digunakan sebagai pembanding
adalah kategori M, maka ξM = 0 untuk
di mana p adalah banyaknya variabel
prediktor, sehingga transformasi logitnya
menjadi,
Multinomial Logit dengan 3
Kategori Respon
Dalam model regresi logistik dengan 3 kategori Y
(Y=0,1,2),dibutuhkan 2 fungsi logit dan harus
diputuskan kategori respon mana yang menjadi
kategori pembanding
Misal Y=0 sebagai kategori pembanding untuk
membentuk 2 logit (yaitu sebagai pembanding
untuk Y=1 dan Y=2) maka
Menurut Hosmer dan Lemeshow (2000)
untuk mendapatkan model, asumsikan
terdapat p variabel prediktor dan n sampel
yang dinotasikan sebagai vektor X dengan
matrik berukuran n x (p+1)di mana X0=1.
Dua fungsi logit dinotasikan sebagai:
Bentuk Umum fungsi peluang
dengan 3 kategori respon
• Secara teori, model dengan 3 kategori peubah
respon akan menghasilkan dua fungsi logit.
• Sebenarnya dapat digunakan pasangan
kategori pembanding yang mana saja
tergantung dari tujuan yang ingin dicapai
dalam penelitian, tetapi menurut Hosmer dan
Lemeshow (2000) lebih baik menggunakan
kategori 0 sebagai pembanding karena
merupakan perluasan dari model dengan dua
• kategori variabel respon (biner).
Pendugaan Parameter
• Pendugaan parameter dari model logit
menggunakan metode maksimum likelihood
• Untuk membuat fungsi likelihood pada
model dengan kategori respon lebih dari 2
(misalnya 3 kategori) hal pertama yang
dilakukan adalah membuat 3 variabel biner
yang dikode 0 atau 1 untuk menandai group
membership (anggota kelompok) pada suatu
observasi
• Dalam kasus ini 3 variabel biner tersebut
hanya untuk menjelaskan fungsi
likelihood dan bukan digunakan untuk
analisis regresi logistik multinomial yang
sebenarnya
Pengujian Terhadap Pendugaan
Parameter
a. Pengujian pendugaan parameter () secara
parsial
Uji koefisien regresi secara parsial digunakan
untuk memeriksa peranan koefisien regresi dari
masing-masing variabel prediktor secara
individu dalam model. Hipotesis yang digunakan
adalah:
Pengujian Terhadap Pendugaan
Parameter
Statistik uji yang digunakan adalah statistik uji
Wald yang dapat ditulis:
Pengujian Terhadap Pendugaan
Parameter
Pengujian Terhadap Pendugaan
Parameter
Pengujian Terhadap Pendugaan
Parameter
Pengujian Terhadap Pendugaan
Parameter
Pengujian Terhadap Pendugaan
Parameter
Interpretasi Koefisien regresi
logistik
• Interpretasi dalam regresi logistik
menggunakan nilai odds ratio yang
menunjukkan perbandingan tingkat
kecenderungan dari kategori yang ada dalam
satu variabel prediktor.
• Nilai odds ratio pada respon multinomial
menggunakan notasi umum yang digunakan
dalam respon biner.
• Misalnya Y=0 digunakan sebagai kategori
pembanding, odd ratio untuk Y=j terhadap
Y=0 yang dihitung pada dua nilai
adalah
• pada regresi logistik politomus dengan tiga
kategori respon akan terbentuk dua odds
ratio.
• Yang pertama perbandingan peluang antara
respon kategori 1 (Y=1) dengan respon
kategori pembanding (Y=0)
• Yang kedua adalah perbandingan peluang
antara respon kategori 2 (Y=2) dengan respon
kategori pembanding (Y=0).
Koefisien Determinasi
Contoh
Suatu penelitian ingin mengetahui berapa
peluang seseorang terkena PJK (Penyakit
Jantung Koroner), PJK disertai hipertensi dan
PJK disertai hipertensi serta diabetes mellitus.
Adapun faktor – faktor yang diduga
mempengaruhi terjadinya PJK dan komplikasinya
adalah usia, tekanan darah sistole, tekanan
darah diastole, kolesterol, HDl, LDL dan
Trigliserid. Variabel Respon:
Y= 0 (PJK), Y= 1 (PJK disertai hipertensi), Y= 2 (PJK
disertai hipertensi dan diabetes mellitus).
Variabel Prediktor:
X1 = Usia (tahun)
X2 = Tekanan darah sistole (mmHg)
X3 = Tekanan darah diastole (mmHg)
X4 = Kolesterol (mg/dl)
X5 = HDL (mg/dl)
X6 = LDL (mg/dl)
X7 = Trigliserid (mg/dl)
Model regresi logistik multinomial setelah
dilakukan transformasi adalah sebagai berikut:
• Model regresi logistik yang pertama
Model regresi logistik yang kedua adalah
Nilai odds ratio model regresi logistik pertama
Interpretasi untuk model logistik pertama,
• Untuk variabel X1 diperoleh nilai odds ratio
sebesar 1.109, berarti setiap bertambahnya 1
tahun usia seseorang yang telah memiliki
faktor-faktor resiko PJK akan meningkatkan
peluang orang tersebut terkena penyakit
jantung koroner sekaligus hipertensi sebesar
1.109 kali.
• Untuk variabel X2
• dengan nilai odds ratio sebesar 9.318 berarti
• Untuk variabel X2 dengan nilai odds ratio
sebesar 9.318 berarti dengan bertambahnya 1
mmHg tekanan darah sistole akan
meningkatkan peluang orang tersebut terkena
penyakit jantung koroner sekaligus hipertensi
sebesar 9.318 kali,
• sedangkan untuk bertambahnya 1 mmHg
tekanan darah diastole (X3) akan
meningkatkan resiko terkena penyakit
• jantung serta hipertensi sebesar 9.309 kali.
• Untuk variabel kolesterol (X4),
mengindikasikan bahwa dengan menurunnya
1 mg/dl kadar kolesterol akan menurunkan
resiko terkena penyakit jantung koroner
sekaligus hipertensi sebesar 0.749 kali.
• Untuk kenaikan 1 mg/dl kadar HDL (X5) akan
meningkatkan resiko terkena PJK serta
hipertensi sebesar 1.704 kali.
•
• Sedangkan untuk penurunan 1 mg/dl kadar
LDL dan kadar trigliserid dapat mengurangi
resiko terkena PJK disertai hipertensi berturut
turut sebesar 0.488 kali dan 0.895 kali.
Nilai odds ratio model regresi logistik kedua
• Interpretasi untuk model logistik kedua, untuk
variabel X1 diperoleh nilai odds ratio sebesar
2.659, berarti setiap bertambahnya 1 tahun
usia seseorang yang telah memiliki faktorfaktor resiko PJK akan meningkatkan peluang
orang tersebut terkena penyakit jantung
koroner disertai hipertensi dan diabetes
mellitus (DM) sebesar 2.659 kali.
Untuk variabel X2 dengan nilai odds ratio
sebesar 6.938 berarti dengan bertambahnya 1
mmHg tekanan darah sistole akan meningkatkan
peluang orang tersebut terkena penyakit
jantung koroner sekaligus hipertensi dan DM
sebesar 6.938 kali,
• bertambahnya 1 mmHg tekanan darah
diastole (X3) akan meningkatkan resiko
terkena penyakit jantung disertai hipertensi
dan DM sebesar 5.667 kali
• variabel kolesterol (X4), mengindikasikan
bahwa dengan menurunnya 1 mg/dl kadar
kolesterol akan menurunkan resiko terkena
penyakit jantung koroner disertai hipertensi
dan DM sebesar 0.977 kali
• Untuk kenaikan 1 mg/dl kadar HDL (X5) akan
meningkatkan resiko terkena PJK disertai
hipertensi dan DM sebesar 1.166 kali.
• Sedangkan untuk penurunan 1 mg/dl kadar
LDL dan kadar trigliserid dapat mengurangi
resiko terkena PJK disertai hipertensi dan DM
berturut turut sebesar 0.891 kali dan 0.866
kali.
TERIMA KASIH
Download