BAB II TINJAUAN PUSTAKA

advertisement
BAB II
TINJAUAN PUSTAKA
2.1
Regresi Logistik
Regresi adalah bagaimana satu variabel yaitu variabel dependen
dipengaruhi oleh satu atau lebih variabel lain yaitu variabel independen dengan
tujuan untuk memprediksi nilai rata-rata variabel dependen didasarkan pada nilai
variabel independen yang telah diketahui. Tujuan utama regresi adalah untuk
memprediksi nilai variabel dependen berdasarkan satu atau lebih variabel
independen (Widarjono, 2010). Banyak kasus dalam analisis regresi dimana
variabel dependennya bersifat kualitatif. Variabel dependen ini bisa mempunyai
dua kelas atau kategori (biner) dan lebih dari 1 kelas (multinomial). Salah satu
pendekatan yang digunakan untuk mengestimasi model regresi dengan variabel
dependen bersifat kualitatif adalah dengan model probabilitas logistik atau
disingkat logit (Widarjono, 2010).
Agresti (2007) menyatakan bahwa variabel dalam regresi logistik dapat
berupa kategori atau kualitatif. Menurut Hosmer dan Lemeshow (1989), tujuan
melakukan
analisis
data
menggunakan
regresi
logistik
adalah
untuk
mendapatkan model terbaik dan sederhana, namun model tersebut sejalan
dengan tinjauan dari ilmu biologi untuk menjelaskan hubungan di antara hasil
(variabel respon) dengan variabel-variabel bebas (variabel penjelas).
2.2
Regresi Logistik Biner
Regresi logistik biner merupakan suatu metode analisis data yang
digunakan untuk mencari hubungan antara variabel respon (y) yang bersifat
5
6
biner atau dikotomus dengan variabel prediktor (x) yang bersifat polikotomus
(Hosmer dan Lemeshow, 2000). Keluaran dari variabel respon y terdiri dari 2
kategori yang biasanya dinotasikan dengan y =1 (sukses) dan y=0 (gagal).
Hosmer dan Lemeshow (2000) menjelaskan bahwa model regresi logistik
dibentuk dengan menyatakan nilai P(Y = 1│x) sebagai π (x) yang dinotasikan
sebagai berikut:
g( )=
( )
(2.1)
( )
Suatu fungsi dari π(x) dicari dengan menggunakan transformasi logit, yaitu g(x)
yang dapat dinyatakan sebagai berikut:
g ( ) = ln [
[ ( )]
( )]
= β0 + β 1x 1 + ⋯ . + β2x 2
(2.2)
Pengujian terhadap parameter-parameter model dilakukan baik secara
simultan maupun secara parsial. Menurut Hosmer dan Lemeshow (2000),
pengujian parameter model secara simultan menggunakan uji nisbah
kemungkinan (Likelihood Ratio Tesis), dengan hipotesis. Menurut Kleinbaum
dan Klein (2002), regresi logistik adalah suatu model pendekatan matematika
yang digunakan untuk menggambarkan hubungan antara beberapa vaiabel
penjelas dengan suatu variabel dikotomi. Variabel dikotomi mempunyai dua
kemungkinan yang biasanya dinyatakan dengan 0 (gagal) dan 1 (sukses).
Diberikan model sebagai berikut:
yi = β0 + β1x1i+……+βpxpi + εi
εi ~ N(0,σ2)
(2.3)
Jika Y diberi 0 dan 1, maka
P(Yi = 1│X = xi) = π(xi) dan P(Yi = 0│X = xi ) =1-π (xi),
nilai harapan dari (yi│xi) adalah E(yi│xi )= π( xi )
Persamaan umum untuk regrsi logistik biner adalah
(2.4)
7
⋯….
π( xi )=
⋯….
(2.5)
Persamaan (1) mempunyai bentuk yang tidak linier. Untuk membuatnya
menjadi persamaan yang linier, maka digunakan transformasi log dari odd rasio
atau disebut juga transformasi logit. Berikut ini adalah logit dari persamaan (1):
( )
( )
= β0+ β1x1i +……+ βp xpi
(2.6)
dengan hipotesis:
H0 : βi =…..=βp = 0
H1 : minimal ada satu βi ≠ 0 ; i = 1,2,….p statistik uji G dirumuskan:
G = -2ln
(2.7)
Diketahui Lo adalah fungsi kemungkinan tanpa peubah penjelas dan
merupakan kemungkinan dengan peubah penjelas. Mengasumsikan H0 benar,
statistik uji G akan mengikuti sebaran khi kuadrat dengan derajat bebas p.
Keputusan tolak H0 jika G > α 2p(α). Interpretasi koefisien untuk model regresi
logistik biner dapat dilakukan dengan menggunakan nilai rasio oddsnya. Odds
sendiri dapat diartikan sebagai rasio peluang kejadian sukses dengan kejadian
tidak sukses dari peubah respon. Rasio odds mengindikasikan seberapa lebih
mungkin munculnya kejadian sukses pada suatu kelompok dibandingkan dengan
kelompok lainnya. Rasio odds didefinisikan sebagai:
Ψ = exp ( ) = exp [g(1)-g(0)]
(2.8)
Interpretasi dari rasio odds ini adalah kecenderungan untuk Y= 1 pada X=1
sebesar Ψ kali dibandingkan pada X= 0 .
8
2.3
Penaksiran Parameter
Untuk penaksiran parameter regresi logistik dapat dilakukan dengan dua cara
yaitu:
a. Maximum Likelihood Estimation (MLE).
Metode
ini
pada
dasarnya
memberikan
nilai
estimasi
β
untuk
memaksimumkan fungsi likelihood (Hosmer dan Lemeshow 1989). Secara
matematis fungsi likelihood (xi.yi) dapat dinyatakan:
f(xi) =π (xi)yi [1-π(xi)]1-yi
karena
setiap
pengamatan
diasumsikan
independen
(2.9)
maka
fungsi
likelihoodnya merupakan perkalian antara masing-masing fungsi likelihood
yaitu:
l (β) = ∏
( )
(2.10)
dan logaritma likelihoodnya dinyatakan sebagai:
L (β) = ln [l(β)]
=∑
( ) +( −
.
)
− ( )
(2.11)
Untuk memperoleh nilai β maka dengan memaksimumkan nilai L(β) dan
mendiferensialkan L(β) terhadap β dan menyamakannya dengan nol.
Persamaan ini dapat ditulis dalam bentuk sebagai berikut:
∑
[
− ( )] = 0
(2.12)
Dan persamaan likelihood:
∑
[
− ( )] = 0
(2.13)
b. Metode Newton Rhapson
Metode ini merupakan metode untuk menyelesaikan persamaan nonlinier
seperti menyelesaikan persamaan likelihood dalam model regresi logistik
9
(Agresti, 1990). Metode newton rhapson memerlukan taksiran awal untuk
nilai fungsi maksimumnya, yang mana fungsi tersebut merupakan taksiran
yang menggunakan pendekatan polynomial berderajat dua. Dalam hal ini
untuk menentukan nilai
Andaikan q’=
+
dari β yang merupkan fungsi maksimum dari g(β).
, … , dan andaikan H dinotasikan sebagai matriks
yang mempunyai anggota hab =
.
. Andaikan q
(t)
dan H(t) merupakan
bentuk evaluasi dari β(t), taksiran t pada β. Pada langkah t dalam proses
iterasi (t = 0,1,2,…), g(β) ialah pendekatan β(t) yang merupakan bentuk orde
kedua dari ekspansi deret Taylor.
Q(t) (β)=gβ(t)+q (t)’(β-β(t))+( )(β-β(t))H(t)( (β-β(t) )
Penyelesaian:
( )
= q(t)+H(t) (β-β(t) )= 0
Β(t+1)= β(t)-(H(t))-1q (t)
Dengan mengansumsikan H(t) sebagai matriks nonsingular.
2.4
Pengujian Signifikansi Parameter
Setelah menaksir parameter maka langkah selanjutnya yang dilakukan
adalah menguji signifikansi parameter tersebut. Untuk itu digunakan uji
hipotesis statistik untuk menentukan apakah variabel terikat berpengaruh
signifikansi parameter dilakukan sebagai berikut:
2.4.1
Uji parsial
Digunakan untuk menguji apakah setiap βi secara individual. Hasil
pengujian secara parsial/individual akan menunjukan apakah suatu variabel
terikat layak untuk masuk dalam model atau tidak (Agresti, 1990).
10
Hipotesis :
H0 : βi = 0
H0 : βi ≠ 0
Statistik Uji : Wald (W) =
(
)
Rasio yang dihasilkan dari statistik uji, dibawah hipotesis H0 akan
mengikuti sebaran normal baku (Hosmer dan Lemeshow, 1989). Sehingga untuk
memperoleh keputusan dilakukan perbandingan dengan distribusi normal baku
(Z). kriteria penolakan (tolak H0 ) jika nilai W>Zα/2
2.4.2
Uji Serentak
Uji serentak disebut juga uji model chi-square, dilakukan sebagai upaya
memeriksa peranan variabel terikat dalam model secara bersama-sama.
Hipotesis :
H0 : β1 = β2=……..= β k = 0
H1 : paling sedikit ada satu β1 ≠ 0 (i = 1,2,….,k)
Statistik uji yang digunakan adalah statistic uji G atau Likelihood Ratio Test:
G2 = -2ln
= −2
(
∏
)
(
(
)
)(
)
(2.14)
Atau :
G2 = 2
{∑
[yi ln(πi)+(1-yi)ln(1-πi)]-[n1ln(n1)+n0ln(n0)-nln(n)]
dimana:
n1 = banyaknya observasi berkategori 1
n0 = banyaknya observasi berkategori 0
}
11
n = banyaknya observasi (n1+n0)
L1 = Likelihood tanpa variabel terikat tertentu
Statistic uji G2 mengikuti distribusi chi-square, sehingga untuk
memperoleh keputusan dilakukan perbandingan dengan X2 tabel. Dimana derajat
bebas = k (banyaknya variabel terikat). Kriteria penolakan (tolak H0) jika nilai G
> X2(db,α).
2.5
Interpretasi Model Pengujian Signifikansi Parameter
Proses selanjutnya adalah mendapatkan interpretasi terhadap model
pengujian signifikansi parameter tersebut. Interpretasi koefisien parameter
diharapkan dapat menjelaskan tiga hal:
a.
Menjelaskan hubungan fungsional antara variabel bebas dan variabel
terikat
b.
Menentukan unit-unit perubahan setiap variabel independen
c.
Mendapatkan nilai odds rasio yang menunjukk perbandingan tingkat
kecenderungan dari kedua kategori dalam satu variabel terikatnya.
Pada regresi logistik, dalam menginterpretasikan parameter digunakan Odds
ratio ( ) . Jika variabel respon y dikategorikan dalam 2 kategori dan dinyatakan
dengan 0 dan 1 dan variabel prediktor juga dibagi dalam 2 kategori dan
dinyatakan dengan kode 0 dan 1. Sehingga pada model berikut ini ada 2 nilai
 ( x ) dan 2 nilai 1-  ( x ) , menurut Hosmer dan Lemeshow (1989) dapat
ditunjukkan pada tabel 2.1 berikut ini.
12
Tabel 2.1 Nilai model regresi logistik untuk x biner
Variabel bebas
X1
Variabel
y1
π(1) =
terikat
y2
X2
π(0) =
1+
1 − π(1) =
1
1+
1+
1 − π(0) =
1
1+
Dengan menggunakan model regresi logistik sesuai tabel diatas maka odds
ratio menjadi:
 e(  0  1 )  1 



1  e(  0  1 )  1  e  0  e  0  1

 
  0  e 1
0
 e

e
1



 0 
(  0  1 ) 

 1  e  1  e
(2.13)
 
Sehingga ln odds ratio atau perbedaan logitnya adalah ln  ln e  1  1
Nilai odds ratio  menunjukkan kecenderungan hubungan suatu variabel
pengamatan x terhadap objek pengamatan y. Bila nilai   1 , maka antara
kedua variabel tersebut tidak terdapat hubungan. Bila   1 , maka terdapat
hubungan negatif terhadap perubahan nilai x bila bernilai benar dan demikian
sebaliknya bila   1 .
2.6
Kanker Payudara (Breast Cancer)
Breast cancer adalah suatu penyakit neoplasma ganas yang merupakan
suatu pertumbuhan jaringan payudara abnormal yang berbeda dengan jaringan
disekitarnya (Pane, 2007). Pertumbuhan sel yang abnormal pada jaringan
payudara seseorang. Payudara wanita terdiri dari lobulus (kelenjar susu), duktus
13
(saluran susu), lemak dan jaringan ikat, pembuluh darah dan limfe. Sebagian
besar breast cancer bermula pada sel-sel yang melapisi duktus (kanker duktal),
beberapa bermula di lobulus (kanker lobular), serta sebagian kecil bermula di
jaringan lain. Sesuai dengan urutan kanker leher Rahim (serviks) merupakan
kanker pembunuh wanita nomor satu di Indonesia dan peringkat kedua di dunia
setelah breast cancer (Messwati, 2005).
Kanker juga merupakan salah satu penyakit tidak menular yang menjadi
masalah kesehatan masyarakat, baik di dunia maupun di Indonesia. Pada breast
cancer dimana kondisi sel telah kehilangan pengendalian dan mekanisme
normalnya, sehingga mengalami pertumbuhan yang tidak normal, cepat dan
tidak terkendali (Hawari, 2004). Efek jangka panjang dari mastektomi
berpengaruh sangat besar terhadap kualitas hidup karena rasa sakit dan
ketidaknyamanan berikutnya. Pembedahan untuk breast cancer adalah
pengalaman yang sangat traumatis dan menakutkan (Galgut, 2010)
Abnormal ganas adalah kanker, tumor-tumor ganas dapat menyerang dan
merusak jaringan disekitarnya
bermetastasis (sel kanker
dan menyebar ke bagian lain dari tubuh,
melepaskan diri dari tumor ganas dan memasuki
aliran darah atau sistem limfatik untuk membentuk tumor sekunder di bagian
lain dari tubuh). Ada dua jenis kalsifikasi payudara;
a. Makrokalsifikasi (macrocalcifications) adalah klasifikasi yang lebih besar
dari 2 mm dan biasanya bukan merupakan indikasi untuk breast cancer.
b. Mikrokalsifikasi (Microcalcification) adalah kalsifikasi lebih kecil dari 1
mm yang berkaitan dengan breast cancer. Mereka dapat muncul dalam pola
yang berbeda. Jumlah mikrokalsifikasi (microcalcification), pengelompokan
14
mereka terhadap kalsifikasi dan polanya memberikan indikasi untuk kanker
payudara (Radstake, 2010).
Sun, dkk (2002) menyajikan sebuah pohon biner classifier
didasarkan pada penggunaan fitur global yang diambil dari berbagai tingkat
dekomposisi 2-D wavelet Quincunx gambar daerah normal dan abnormal.
Ada dua jenis kesalahan utama klasifikasi: (1) adalah karena tepi jaringan
kepadatan normal yang terang, (2) adalah karena batas antara otot-otot dada
dan daerah payudara, yang sebagian besar ditampilkan dalam tampilan
MLO. Fitur karakteristik perlu diselidiki lebih lanjut dalam rangka
meningkatkan efisiensi pohon keputusan classifier dan mengurangi tingkat
kesalahan klasifikasi klinis kritis daerah abnormal (Sun, Babbs, dan Delp,
2002).
Kebanyakan breast cancer memiliki asal usul mereka dalam sel-sel
dari saluran (ducts) dan beberapa di sel-sel dari lobulus, yang memproduksi
kelenjar susu (Radstake, 2010). Pasien yang telah menjalani mastektomi
akan merasa cemas terhadap penyakit breast cancer yang mungkin belum
hilang sepenuhnya dari tubuhnya (Maguire dan parkes, 1998).
Gejala breast cancer
Pada tahap awal Breast Cancer, biasanya tidak merasakan sakit atau
tidak ada tanda-tandanya sama sekali. Namun, ketika tumor semakin membesar,
gejala-gejala ini mungkin muncul (Anita, 2007)
1. Benjolan yang tidak hilang atau permanen dan menggumpal, biasanya tidak
sakit dan terasa keras bila disentuh atau penebalan pada kulit payudara atau
disekitar ketiak.
15
2. Perubahan ukuran dan bentuk payudara
3. Kerutan pada kulit payudara
4. Keluar cairan tidak normal dari puting susu yang berubah nanah, darah,
cairan encer atau keluar air susu pada ibu tidak hamil atau tidak sedang
menyusui.
5. Pembengkakan atau adanya tarikan pada puting susu.
Download