Bayesian Survival Analysis Untuk Mengestimasi Parameter Model

advertisement
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER
MODEL KETAHANAN HIDUP PASIEN PENDERITA
JANTUNG KORONER
THE USE OF BAYESIAN SURVIVAL ANALYSIS TO ESTIMATE
PARAMETERS OF SURVIVAL MODEL FOR CORONARY HEART
DISEASE’S PATIENTS
Oleh:
A. DEWI LUKITASARI
662011009
TUGAS AKHIR
Diajukan kepada Program Studi Matematika, Fakultas Sains dan Matematika,
guna memenuhi sebagian dari persyaratan untuk memperoleh Gelar Sarjana Sains
(Matematika)
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS KRISTEN SATYA WACANA
SALATIGA
2015
i
ii
iii
iv
MOTTO
“Do your best and lets God do the rest”
(Anonim)
“FULL TILT!”
(James Gwee)
“It doesn’t matter how hard the obstacles are, you must finish what you started”
(Vivi Adeliana)
PERSEMBAHAN
Tuhan Yesus Kristus
Keluarga
v
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena atas
berkatnya yang melimpah penulis dapat menyelesaikan skripsi ini tepat waktu.
Penulis menyadari, penulisan skripsi ini tidak lepas dari bantuan dan dukungan dari
berbagai pihak. Oleh karena itu penulis ingin menyampaikan ucapan terima kasih
kepada :
1. Dr. Adi Setiawan, M.Sc selaku pembimbing I atas bimbingan, motivasi dan
kesabarannya dalam membimbing agar segera menyelesaikan skripsi ini.
2. Leopoldus Ricky Sasongko, M.Si sebagai pembimbing II untuk bimbingan
dan koreksi yang diberikan dalam penyusunan skripsi ini.
3. Dosen pengajar, Dr. Bambang Susanto,MS, Dr. Hanna Arini Parhusip, Dra.
Lilik Linawati, M.Kom, Dr. Didit Budi Nugroho, dan Tundjung Mahatma,
M.Kom untuk ilmu dan bimbingan yang diberikan kepada penulis selama
belajar di Program Studi Matematika.
4. Staf TU dan Pak Edy untuk bantuannya saat kesulitan instal software.
5. Bapak, Ibuk, Kakak dan Adik atas segala dukungan, semangat dan doa yang
diberikan.
6. Mas Restu yang selalu memberikan semangat untuk tidak pernah putus asa
selama proses penyelesaian skripsi.
7. Freda, Dek Tina dan Mbak Nina yang selalu memberikan semangat dalam
penyelesaian skripsi ini.
8. Rekan seperjuangan Matematika 2011 Daivi, Titis, Priska, Purwoto, Dwi,
Malik dan Kevin.
Penulis menyadari bahwa skripsi ini masih banyak kekurangan. Oleh sebab itu,
penulis mengharapkan kritik dan saran yang membangun dari pembaca. Semoga
skripsi ini dapat bermanfaat bagi semua pihak.
Salatiga, 21 Januari 2015
Penulis
vi
DAFTAR ISI
Halaman
i
HALAMAN JUDUL…………………………………………………………………
PERNYATAAN KEASLIAN KARYA TULIS TUGAS AKHIR…………………..
ii
PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR
UNTUK KEPENTINGAN AKADEMIS…………………………………………….
iii
HALAMAN PENGESAHAN…………………………………………………….….
iv
MOTTO DAN PERSEMBAHAN……………………………………………..…….
v
KATA PENGANTAR………………………………………………………….……
vi
DAFTAR ISI…………………………………………………………………..……..
vii
ABSTRAK……………………………………………………….…………………..
viii
ABSTRACT………………………………………………………………………….
ix
PENDAHULUAN……………………………………………………………………
x
MAKALAH 1 : Bayesian Survival Analysis untuk mengestimasi parameter
model Cox-Regression pada kasus ketahanan hidup pasien
penderita jantung koroner.
MAKALAH 2 : Bayesian Survival Analysis ntuk mengestimasi parameter
model Weibull-Regression pada kasus ketahanan hidup pasien
penderita jantung koroner.
PENUTUP………………………………………...…………………….………. .....
DAFTAR PUSTAKA………………………………………………………………..
LAMPIRAN 1 : Data survival pasien penderita jantung koroner………………..…
LAMPIRAN 2 : Program WINBUGS 1.4 untuk Bayesian Survival Analysis
menggunakan Cox-Regression …………………………………...
xiii
xiv
xvi
xvii
LAMPIRAN 3 : Program WINBUGS 1.4 untuk Bayesian Survival Analysis
menggunakan Weibull-Regression……………………………...……
xx
LAMPIRAN 4 : Manual penggunaan WINBUGS 1.4……………………………...
xxi
LAMPIRAN 5 : Makalah 1 Publikasi…………………………….............................
xxi
LAMPIRAN 6 : Sertifikat Publikasi…………………………….................................
xxi
vii
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER
MODEL KETAHANAN HIDUP PASIEN PENDERITA
JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3
Program Sudi Matematika, Fakultas Sains dan Matematika,
Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
1
[email protected],2 [email protected],
3
[email protected]
ABSTRAK
Skripsi ini membahas mengenai analisis survival menggunakan CoxRegression dan Weibull-Regression untuk mengestimasi parameter model ketahanan
hidup pasien penderita jantung koroner dengan pendekatan Bayesian. Data yang
digunakan adalah data survival pasien penderita jantung koroner dan data tersensor
hasil simulasi meliputi waktu hidup pasien, status pasien (hidup/mati) dan treatment
yang dikenakan pada pasien yaitu ring dan bypass, dengan jumlah pasien sebanyak
40 orang. Pendekatan Bayesian (Bayesian approach) digunakan untuk mengestimasi
parameter yang belum diketahui dari model regresi yang digunakan. Metode Markov
Chain Monte Carlo (MCMC) menggunakan algoritma Gibbs Sampling digunakan
untuk membangkitkan Rantai Markov untuk mengestimasi distribusi posterior dari
parameter, meliputi koefisien regresi (  ) dari masing-masing model dan parameter r
dari model survival Weibull. Parameter  dan r yang diperoleh digunakan untuk
menghitung fungsi survival tiap pasien sesuai dengan treatment yang dikenakan.
Fungsi survival menunjukkan probabilitas bertahan hidup pasien penderita jantung
koroner. Berdasarkan analisis kedua model regresi, pada kasus penderita jantung
koroner, Weibull-Regression kurang mampu memodelkan data survival pasien
penderita jantung koroner karena diperoleh nilai probabilitas yang kurang wajar yakni
bernilai 0 untuk treatment bypass.
viii
Kata Kunci : Survival Analysis, model Weibull-Regression, Bayesian, Markov
Chain Monte Carlo (MCMC)
THE USE OF BAYESIAN SURVIVAL ANALYSIS TO ESTIMATE
PARAMETERS OF SURVIVAL MODEL FOR CORONARY HEART
DISEASE’S PATIENTS
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3
Mathematics Department, Faculty of Science and Mathematics,
Satya Wacana Christian University, Jl.Diponegoro No.52-60, Salatiga.
1
[email protected],2 [email protected],
3
[email protected]
ABSTRACT
This study examined survival analysis using Cox and Weibull-Regression to
estimate survival model for coronary heart disease’s patients. Survival and censored
data simulation of coronary heart disease’s patients were used for data collection,
including survival time, survival status (life or die) and custom treatment (ring and
bypass). The total number of patients was 40 patients. Bayesian approach was
applied to estimate unknown parameter from regression models. Markov Chain
Monte Carlo (MCMC) method using Gibbs Sampling algorithm generated Markov
Chain to estimate posterior distribution of parameter that included regression
coefficient (  ) from each models and r parameter from Weibull’s model. Parameter
that had been found was to count survival function from each patient in each
treatment. This showed life probability of coronary heart disease’s patients.
Regarding the analysis from the two models, in context of coronary heart’s diseases
Weibull-Regression not really good in modeling of survival data of coronary heart’s
diseases patients because the result of the probability were bad.
Keywords : Survival analysis, Cox-Regression model, Weibull-Regression,
Bayesian, Markov Chain Monte Carlo (MCMC)
ix
PENDAHULUAN
Latar Belakang
Kemajuan ilmu pengetahuan dan teknologi yang memunculkan inovasi di
berbagai aspek kehidupan, membawa dampak pada perubahan pola hidup masyarakat
yang cenderung serba instan.
Pola hidup tersebut membawa dampak negatif.
Diantaranya muncul berbagai jenis penyakit yang berbahaya dan mematikan, salah
satunya adalah penyakit jantung koroner. Karena penyakit ini sangat berbahaya maka
seseorang yang terkena penyakit ini mungkin melakukan investasi/ asuransi sebagai
bentuk antisipasi apabila sewaktu-waktu penyakit ini kambuh dan harus menjalani
perawatan ,operasi atau meninggal dunia. Perusahaan asuransi perlu untuk
menentukan peluang waktu hidup pemegang polis yang menderita jantung koroner.
Peluang hidupnya biasa direpresentasikan dengan tabel mortalitas.
Inovasi yang berkembang meliputi bidang aktuaria, engineering dan
biostatistik yaitu munculnya survival analysis yang digunakan untuk memodelkan
data survival Survival analysis bertujuan menduga probabilitas kelangsungan hidup,
kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta
menjelaskan pengaruh variabel independent terhadap waktu hidup. Teknik analisis
yang biasa digunakan antara lain parametric, semi-parametric dan non-parametric.
Salah satu teknik analisis parametric yang digunakan adalah Weibull-Regression
sedangkan teknik analisis
non-parametric sederhana yang digunakan untuk
memodelkan data survival adalah model Cox-regression.
Kenyataannya, selama proses observasi dimungkinkan terdapat data yang
tidak terobservasi secara penuh (not completely observed) yang disebut data
tersensor. Oleh karena itu untuk mengolah data tersensor digunakan teknik analisis
parametric menggunakan model Weibull. Distribusi Weibull digunakan secara
efektif untuk menganalisis data waktu hidup khususnya untuk data tersensor.
Saat ini dikenal ada dua pendekatan model yaitu pendekatan klasik (classical
approach) dan pendekatan Bayesian (Bayesian approach). Keunggulan pendekatan
Bayesian diantaranya mampu menyelesaikan masalah yang tidak dapat diselesaikan
x
secara analitis dan mampu menawarkan kemungkinan yang kaya dengan interferensia
serta mengeksplor perbedaan-perbedaan interpretasi data terhadap kriteria kinerja
prior. Pada proses pemodelannya menggunakan estimasi Bayesian dengan bantuan
Markov-Chain Monte-Carlo (MCMC) berdasarkan algoritma Gibbs Sampling.
Berdasarkan uraian di atas, pada skripsi ini dibahas analisis survival untuk
model dengan Cox-Regression dan Weibull-Regression menggunakan pendekatan
klasik kemudian dilanjutkan dengan menggunakan pendekatan Bayesian untuk
mengestimasi parameter dari model yang digunakan. Pada model Cox-Regression
digunakan data pasien penderita jantung koroner yang dikenakan pengobatan dengan
treatment Ring dan Bypass, sedangkan untuk model Weibull-Regression digunakan
data survival simulasi pasien penderita jantung koroner. Total pasien adalah sebanyak
40 pasien. Treatment Ring adalah teknik pengobatan jantung koroner dengan cara
memasangkan cincin pada jantung untuk melebarkan pembuluh darah yang
menyempit atau tersumbat di bagian jantung, sedangkan treatment Bypass adalah
teknik pengobatan dengan mengambil pembuluh darah vena yang diambil dari vena
lengan atau kaki.
Rumusan Masalah
Berdasarkan uraian latar belakang tersebut, permasalahan yang dibahas dalam
penelitian ini adalah :
1. Bagaimana mengestimasi parameter pada model Cox-Regression dengan
Bayesian survival analisis pada kasus ketahanan hidup pasien penderita
jantung koroner?
2. Bagaimana mengestimasi parameter pada model Weibull-Regression dengan
Bayesian survival analisis pada kasus ketahanan hidup pasien penderita
jantung koroner?
xi
Tujuan
Tujuan dari penelitian ini adalah :
1. Memperoleh
nilai
parameter
pada
model
Cox-Regression
dengan
menggunakan Bayesian survival analisis pada kasus ketahanan hidup pasien
penderita jantung koroner.
2. Memperoleh nilai parameter pada model Weibull-Regression dengan
menggunakan Bayesian survival analisis pada kasus ketahanan hidup pasien
penderita jantung koroner.
Batasan Masalah
Beberapa hal yang membatasi penelitian ini adalah :
 Diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan.
 Diasumsikan data termasuk ke dalam tipe data Random Censoring.
Manfaat penelitian
Penelitian ini dapat bermanfaat untuk perusahaan asuransi jiwa kategori manfaat
penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance
calculations) seperti alat pengukur pembentuk rate premi yang akan digunakan untuk
membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk
cakupan asuransi.
Untuk menyelesaikan rumusan masalah tersebut, maka dibuat dua makalah yaitu :
1. Bayesian
Survival
Analysis
menggunakan
Cox-Regression
untuk
mengestimasi model ketahanan hidup pasien penderita jantung koroner yang
telah diseminarkan di Universitas Muhammadiyah Purworejo pada tanggal 29
November 2014.
2. Bayesian Survival Analysis untuk mengetimasi parameter model WeibullRegression pada kasus ketahanan hidup pasien penderita jantung koroner.
xii
PENUTUP
Kesimpulan
Berdasarkan analisis yang dilakukan, diperoleh nilai dari setiap parameter
yang diestimasi meliputi, koefisien regresi   dan  0 pada model Cox-Regression.
Parameter r dan koefisien regresi   untuk model Weibull-Regression. Didapatkan
probabilitas pasien bertahan hidup untuk masing-masing treatment yakni treatment
Ring dan Bypass. Diperoleh adanya kelemahan untuk model Weibull-Regression
dalam memodelkan ketahanan hidup pasien penderita jatung koroner karena
menghasilkan nilai probabilitas yang kurang wajar dikarenakan pada analisis dengan
menggunakan Weibull-Regression diperoleh nilai probabilitas untuk treatment
Bypass sebesar nol.
Saran
Penelitian ini dapat diaplikasikan untuk perusahaan asuransi jiwa kategori
penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance
calculations) seperti alat pengukur pembentuk rate premi yakni menghitung nilai
probabiltas kematian pemegang polis yang akan digunakan untuk membuat
perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk cakupan
asuransi.
xiii
DAFTAR PUSTAKA
[1]
Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.
[2]
Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia
2005. Jakarta.
[3]
World Health Organization. 2014. The top 10 causes of death. Swiss: WHO.
diakses pada Senin,15 September 2014 pukul 9.41.
http://www.who.int/mediacentre/factsheets/fs310/en/.
[4]
London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
[5]
Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada
Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan
SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores.Jurusan
Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam.Universitas
Harsanudin : Makassar.
[6]
Subanar.2013.Statistika Matematika.Graha Ilmu: Yogyakarta.
[7]
Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data.
Universitas Cagliari: Italia.
[8]
Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan MantelHaenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas
Diponegoro : Semarang.
[9]
Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan
Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro:
Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[10] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data. New York. Springer-Verlag New York Inc.
[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses
pada Selasa 16 September 2014 pukul 20.12.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html
xiv
[12] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox
Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus.
Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[13] Hidayah,Entin.2013.Model Disagregasi Data Hujan Temporal dengan
Pendekatan Bayesian sebagai Input Permodelan Banjir.ITS:Surabaya.
[14] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model
with Changing from the Baseline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
xv
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGETIMASI PARAMETER
MODEL COX-REGRESSION PADA KASUS KETAHANAN HIDUP
PASIEN PENDERITA JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3
Program Sudi Matematika, Fakultas Sains dan Matematika,
Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
1
[email protected],2 [email protected],
3
[email protected]
ABSTRAK
Penerapan model Cox-Regression dalam konteks survival analysis dengan
pendekatan Bayesian untuk memodelkan ketahanan hidup pasien penderita jantung
koroner dibahas dalam paper ini. Data yang digunakan adalah waktu hidup pasien,
status pasien (hidup/mati) dan treatment yang dikenakan. Diambil dua treatment yang
digunakan oleh pasien penderita jantung koroner yaitu ring dan bypass. Pendekatan
yang digunakan adalah pendekatan Bayesian (Bayesian approach) untuk mencari
distribusi posterior parameter. Updating data menggunakan metode Markov Chain
Monte Carlo (MCMC) dengan algoritma Gibbs Sampling. Software winBUGS 1.4
membantu dalam mengestimasi nilai setiap parameter yaitu koefisien regresi
.
Parameter yang diestimasi dari model Cox-Regression digunakan untuk menghitung
probabilitas bertahan hidup pasien penderita jantung koroner.
Kata Kunci : Survival Analysis, model Cox-Regression, Bayesian, Markov Chain
Monte Carlo (MCMC)
1
PENDAHULUAN
Kemajuan ilmu pengetahuan dan teknologi yang kian pesat menuntut berbagai
aspek untuk menemukan inovasi guna mempermudah kehidupan manusia. Inovasi
teknologi yang serba canggih membawa dampak pada perubahan pola hidup
masyarakat yang cenderung serba instan. Tidak dapat dipungkiri pola hidup tersebut
membawa dampak negatif. Diantaranya muncul berbagai jenis penyakit yang
berbahaya dan mematikan, salah satunya adalah penyakit jantung koroner [1].
Menurut World Health Organization (WHO) atau Badan Kesehatan Dunia, penyakit
jantung koroner merupakan penyakit dengan urutan pertama penyebab kematian dan
tersebar di seluruh dunia. Pada tahun 2012 tercatat 7,2 juta orang di seluruh dunia
meninggal setiap tahunnya akibat penyakit ini. Banyaknya orang yang meninggal
akibat ini diperkirakan akan terus meningkat hingga 23,3 juta di tahun 2030 [2].
Karena penyakit ini sangat berbahaya maka seseorang yang terkena penyakit ini akan
melakukan investasi sebagai bentuk antisipasi apabila sewaktu-waktu penyakit ini
kambuh dan harus menjalani perawatan atau operasi. Perusahaan asuransi perlu untuk
menentukan peluang waktu hidup seseorang yang akan melakukan asuransi. Peluang
hidupnya biasa direpresentasikan dengan membuat tabel mortalitas.
Angka kematian yang tinggi akibat penyakit jantung koroner menimbulkan
perkembangan inovasi di bidang aktuaria, engineering dan biostatistik yaitu
munculnya survival analysis yang digunakan untuk memodelkan data survival [3].
Survival analysis bertujuan menduga probabilitas kelangsungan hidup, kekambuhan,
kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta
mejelaskan pengaruh variabel independent terhadap waktu survive [4]. Teknik
analisis yang biasa digunakan antara lain parametric, semi-parametric dan nonparametric [5]. Salah satu teknik analisis non-parametric sederhana yang digunakan
untuk memodelkan data survival adalah model Cox-regression. Sedangkan untuk
permodelan data dikenal ada dua pendekatan yaitu pendekatan klasik (classical
approach) dan pendekatan Bayesian (Bayesian approach) [6]. Pendekatan klasik
2
memandang parameter bernilai tetap, sedangkan pada pendekatan bayesian parameter
dipandang sebagai variabel random yang memiliki distribusi (distribusi Prior).
Keunggulan pendekatan Bayesian diantaranya mampu menyelesaikan masalah yang
tidak dapat diselesaikan secara analitis dan mampu menawarkan kemungkinan yang
kaya dengan interferensia serta mengeksplor perbedaan-perbedaan interpretasi data
terhadap kriteria kinerja prior [7]. Estimasi parameter model menggunakan estimasi
Bayesian dengan metode Markov-Chain Monte-Carlo (MCMC) berdasarkan
algoritma Gibbs Sampling. Salah satu kontribusi yang dapat bermanfaat bagi
perusahaan asuransi kejiwaan untuk penyakit kritis seperti asuransi operasi dalam
membuat kalkulasi asuransi (insurance calculations) yang akan digunakan untuk
membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk
cakupan asuransi.
Berdasarkan uraian di atas, pada paper ini dibahas terlebih dahulu cara
mengestimasi parameter menggunakan pendekatan klasik dengan menggunakan
model regresi Cox-Proporsional Hazard pada kasus ketahanan hidup pasien
penderita jantung koroner, kemudian dilanjutkan dengan menggunakan pendekatan
Bayesian survival analysis menggunakan Cox-regression. Tujuan dari penelitian ini
untuk memperoleh model ketahanan hidup pasien penderita jantung koroner dengan
Bayesian survival analysis menggunakan Cox-regression. Dalam proses estimasi
diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan. Hal
tersebut berarti terdapat asumsi bahwa satu pasien hanya dapat mengalami satu kali
kegagalan dan satu pasien hanya dikenakan satu treatment saja. Alat bantu
perhitungan menggunakan paket program winBUGS 1.4 yang telah memuat
algoritma BUGS (Bayesian Interface Using Gibbs Sampling).
3
DASAR TEORI
Fungsi Survival
Fungsi survival S (t ) merupakan probabilitas dari seseorang untuk bertahan
hidup setelah waktu yang ditetapkan sebut t . Fungsi survival merupakan merupakan
komplemen dari variabel random fungsi distribusi kumulatif F (t ) maka ditulis
S (t )
P(T
t ) 1 F (t ) [8]. Fungsi distribusi kumulatif dari variabel random T
dengan fungsi kepadatan probabilitas (probability density function) f (t ) , diperoleh
dengan cara mengintegralkan fungsi kepadatan probabilitas sehingga diperoleh
t
F (t )
P(T
f (t )dt dengan T adalah variabel random yang mencerminkan
t)
0
failure time atau waktu bertahan hidup sampai munculnya kejadian tertetu. Kejadian
yang dimaksud adalah kematian [9].
Fungsi Hazard
Fungsi Hazard
0
(t ) menunjukkan laju kegagalan individu untuk mampu
bertahan hidup setelah melewati waktu yang ditetapkan, t . Didefinisikan sebagai
berikut :
0
(t )
lim
dt
0
P(t
T
t dt | T
dt
t)
lim
dt
0
P(t
T t dt )
P(T t )
F ' (t )
S (t )
(1)
dengan T asumsikan kontinu sehingga memiliki fungsi kepadatan probabilitas dan
kejadian berlangsung untuk rentang waktu [t , t dt ) [10]. Untuk fungsi Hazard
kumulatif yaitu
t
0 (t )
0
(u )du
0
Proses Intensitas dan model regresi Cox
Data survival yang ada perlu dilakukan proses menghitung jumlah kegagalan
yang terjadi sampai waktu t . Proses tersebut dinamakan proses intensitas. Proses
4
(2)
intensitas I i (t ) , merepresentasikan hubungan probabilitas subjek i , i 1, 2, ..., n
pada interval [t , t
dt ) . Dirumuskan :
Ii (t )dt E(dN (t ) 1 | Ft )
(3)
N i (t ) menunjukkan kenaikan dari N i untuk interval [t , t
dt ) , Ft menunjukkan
data yang ada sebelum waktu t . Jika nilai i masuk di interval waktu maka diambil
nilai dN i (t ) 1 dan sebaliknya jika tidak maka diambil nilai dN i (t )
Jika nilai dt
0.
0 untuk D {N i (t ), Yi (t ), z i (t )} , probabilitas pada proses
intensitas berubah menjadi instantaneous hazard untuk waktu t dan subjek i
ditunjukkan pada persamaan di bawah ini
I i (t ) Yi (t ) 0 (t ) exp( ' zi )
(4)
dengan D mencerminkan data, Yi (t ) adalah indikator risiko yang ditunjukkan dari
status hidup pasien terdiri dari 0 atau 1 dan zi (t ) adalah vektor covariate. Model
Cox-Regression ditunjukkan dari
individu ke- i . Parameter
0
(t ) exp( ' zi ) yang menunjukan skor risiko untuk
menunjukkan koefisien regresi.
Fungsi eksponensial menjamin I i (t ) bernilai positif. Probabilitas fungsi
survival dirumuskan sebagai berikut :
t
S (t , z )
exp((
0
(u )du ) exp( z ) )
(5)
0
t
Parameter
dan nilai
0 (t )
0
(u )du yang akan diestimasi dengan estimasi non-
0
parametric yang akan digunakan untuk mengestimasi model survival [11].
Distribusi Prior
Distribusi prior mencerminkan kepercayaan subyektif parameter sebelum sampel
diambil. Penentuan distribusi prior dapat ditentukan berdasarkan ruang parameternya.
5
Penentuan
d
0
prior
(t ) ~ Gamma(cd
dengan
*
0
(t ), c) . d
mengambil
*
0
N i (t )
konjugat
sehingga
(t ) menunjukann perkiraan prior dari fungsi
hazard yang belum diketahui dan c menujukkan derajat konfidensi [11].
Fungsi Likelihood
Fungsi likelihood yang biasa digunakan adalah :
L( D | ,
0
(t )))
Li ( D | ,
0
(6)
(t ))
n
L( D | ,
I i (t ) dNi (t ) exp
0 (t )
i 1
t 0
t 0
I i (t ) dt
(7)
Mengganti nilai I i (t ) dengan persamaan (4) diperoleh persamaan likelihood sebagai
berikut:
n
L( D | ,
0 (t ))
(Yi (t ) exp( ' z i )d
i 1
0
(t )) dNi (t ) exp
t 0
t 0
(Yi (t ) exp( ' z i )d
0
(t ) dt
(8)
dengan
d 0 (t )
mencerminkan
kenaikan
dari
fungsi
hazard,
dN i (t ) ~ Poisson( I i (t ))dt merupakan kenaikan yang sangat kecil dari N i (t ) dan
0
(t ) menunjukkan baseline hazard function terintegrasi selama interval [t , t dt )
[5].
Distribusi Posterior
Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat
ditentukan maka distribusi posteriornya dicari dengan mengalikan priornya dengan
informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai berikut:
P( ,
0
(t ) | D)
L( D | ,
Akan difokuskan dalam mengestimasi parameter
0
(t ) P( ) P(
dan
0
0
(t )) .
(9)
(t ) . Karena model cukup
kompleks distribusi posterior susah untuk dicari secara langsung maka perlu adanya
suatu pendekatan menggunakan metode simulasi dengan MCMC (Markov Chain
Monte Carlo). Pada proses MCMC dipilih menggunakan algoritma Gibbs Sampling.
6
Kemudahan yang diperoleh dari penggunaan metode MCMC pada analisis
Bayesian antara lain metode MCMC dapat menyederhanakan bentuk integral yang
kompleks dengan dimensi besar menjadi bentuk integral yang sederhana dengan satu
dimensi. MCMC dapat mengestimasi densitas data dengan cara membangkitkan suatu
rantai Markov yang berurutan sebanyak N yang cukup besar sampai diperoleh
konvergen [12]. Salah satu keunggulan MCMC terletak pada performa yang tidak
terlalu sensitif pada penggunaan nilai awal.
Proses penyusunan algoritma Gibbs Sampling perlu ditentukan nilai awal dari
parameter yang akan diestimasi yaitu
penyusunan
( P( | D,
0
algoritma
(t )), P(
0
Gibbs
0
~ Normal (0,
Sampling
2
) dan
mengikuti
0
prosedur
(t ) . Manual
penentuan
(t ) | D, )) dengan langkah pada persamaan (10) dan (11) yaitu
P( | D,
0
(t ))
P( ) P( D | ,
0
(t ))
(10)
dan
P(
0
(t ) | D, )
P(
0
(t )) .
(11)
Langkah pada persamaan (10) dan (11) diulang sebanyak B yang cukup besar, dengan
B merupakan banyaknya update pada penyusunan rantai Markov hingga diperoleh
deret rantai Markov yang konvergen.
Gibbs Sampling termasuk ke dalam dua kategori algoritma utama
dalam MCMC selain algoritma Metropolis. Gibbs Sampling adalah teknik
membangkitkan variabel acak dari distribusi marginal secara tidak langsung tanpa
harus menghitung densitasnya.
7
METODE PENELITIAN
Profil data
Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan
treatment yang digunakan pasien penderita jantung koroner [4]. Data ditunjukkan
pada Tabel 1. Pasien sebanyak 40 pasien dan pasien yang mengalami kegagalan
(meninggal) saat menjalani treatment sebanyak 8 pasien.
Langkah-langkah penelitian
Pengolahan data dengan menggunakan software winBUGS 1.4. Software
winBUGS 1.4 adalah paket program yang dirancang khusus untuk memfasilitasi
permodelan data Bayesian menggunakan implementasi MCMC yang bekerja dalam
sistem operasi windows. Pengolahan data survival dilakukan dengan tahapan dan
spesifikasi model meliputi pengecekan terhadap syntax model, loading data,
compiling model, inisialisasi, menentukan iterasi MCMC sebanyak 10.000 kali guna
membangkitkan Rantai-Markov. Penyusunan parameter
dan node Ring serta node
Bypass. Updating data parameter sebanyak 10.000. Dalam ploting masing-masing
node dan parameter beta nilai Markov dilakukan burn in sebanyak 5000 data, dan
diambil bangkitan rantai dari data ke 5001 sampai dengan 10.000.
Tabel 1. Data waktu bertahan hidup pasien penderita jantung koroner
No
1
2
3
4
5
6
7
8
9
10
11
12
Waktu
(bulan)
26
26
38
51
52
56
57
61
62
62
66
71
Status
Treatment
No
0
0
0
0
0
0
0
1
0
0
0
1
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
21
22
23
24
25
26
27
28
29
30
31
32
8
Waktu
(bulan)
32
33
42
42
56
56
60
65
78
87
87
93
Status
Treatment
0
0
0
0
0
0
1
0
0
0
0
0
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
13
14
15
16
17
18
19
20
71
75
83
106
123
128
156
183
0
0
0
0
0
0
0
0
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
33
34
35
36
37
38
39
40
102
116
116
146
161
173
178
182
0
0
1
1
0
1
1
1
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
ANALISIS HASIL
Proses analisis dilakukan pada data survival yang terdiri dari n 40 dan
T
8 , dengan n menyatakan total pasien dan T menunjukkan pasien yang mengalami
kegagalan dalam proses treatment. Digunakan dan diselidiki terlebih dahulu dengan
pendektan klasik yaitu Regresi Cox-Proporsional Hazard dengan load packages
survival yang ada pada software R i386 3.0.1. Waktu hidup dan status sebagai
variabel yang dependent terhadap treatment. Hal tersebut berarti treatment sebagai
variabel independent dan probabilitas survival tergantung pada jenis treatment yang
digunakan. Diperoleh gambaran hasil yang dinyatakan pada Tabel 2.
Tabel 2. Hasil estimasi node Ring dengan metode klasik non-parametrik
Node
Waktu
Survival
Ring [1]
Ring [2]
61
71
0.923
0.821
Standard
Batas
Batas
Error
minimum
Maksimum
0.0739
0.1169
0.798
0.621
1
1
Tabel 3. Hasil estimasi node Bypass dengan metode klasik non- parametric
Batas
Node
Waktu
Survival
Standard
Error
minimum
Batas
Maksimum
Bypass[1]
Bypass[2]
Bypass[3]
Bypass[4]
60
116
146
173
0.929
0.796
0.637
0.424
0.0688
0.1362
0.1793
0.2105
0.8030
0.5691
0.3667
0.1606
1
1
1
1
9
Bypass[5]
Bypass[6]
178
182
0.212
0.000
0.1833
-
0.0391
-
1
-
Tabel 4. Hasil estimasi parameter Beta dengan metode klasik
Node
Survival
Estimasi
Titik
Batas
minimum
Batas
Maksimum
Beta
0.408
-0.6851
0.0778
0.9053
Tabel 4. menunjukkan nilai estimasi titik yang sekaligus menunjukkan nilai
koefisien regresi yakni sebesar -0.6851. Tingkat signifikansi alfa sebesar 0.5%.
Estimasi interval diambil dengan mengambil exponensial dari minus lower.95 dan
minus upper.95. Batas bawah dan batas atas diperoleh (0.0778, 0.9053) dengan
probabilitas 0.408 yang sudah signifikan karena nilai probabilitasnya lebih besar dari
0.05. Dengan estimasi non parametrik gambaran nilai probabilitas pasien bertahan
hidup untuk masing-masing treatment yang dikenakan terdapat pada Tabel 2 dan
Tabel 3. Ditunjukkan bahwa nilai probabilitas tertinggi ada dalam kelompok bypass
dengan nilai probabilitas sebesar 0.929
hanya selisih cukup kecil yaitu 0.005
signifikan dengan pasien dengan ring yang memiliki probabilitas tertinggi 0.923.
Gambaran grafik
estimasi mean dari fungsi survival ditunjukan
pada
Gambar 1. Pada Gambar 1. Sumbu horizontal menunjukkan waktu bertahan hidup
pasien penderita jantung koroner dalam satuan bulan , sedangkan sumbu vertical
menunjukkan presentase subjek yang masih bertahan hidup. Garis putus-putus pada
Gambar 1. menunjukkan garis survival untuk treatment Ring dan Bypass. Grafik
memiliki kecenderungan mengalami penurunan secara bertahap, tidak dapat
dipungkiri probabilitas pasien untuk bertahan hidup juga semakin kecil. Pada Gambar
1. Terlihat bahwa probabilitas bertahan hidup penderita dengan treatment ring jauh
lebih besar karena penurunan probabilitas tidak sesignifikan jika dengan
menggunakan bypass
.
10
0.6
0.4
Survival Probability
0.8
1.0
Gambar 1. Estimasi mean fungsi survival untuk treatment Ring dan Bypass
Bypass
0.0
0.2
Ring
0
50
100
150
survival Time in Months
Hasil nilai estimasi dan karakteristik untuk masing-masing parameter
ditunjukkan pada Tabel 5, Tabel 6, dan Tabel 7.
Tabel 5. Hasil estimasi Bayesian node Ring
Node
Mean
Standard
Deviasi
Ring[1]
Ring[2]
Ring[3]
Ring[4]
Ring[5]
Ring[6]
Ring[7]
Ring[8]
0.9771
0.9536
0.9262
0.8781
0.8119
0.7185
0.613
0.4868
0.02706
0.04169
0.05832
0.09146
0.1333
0.182
0.2202
0.2417
MC error
( 10 4 )
3.18
5.01
7.47
12.58
19.61
26.98
33.35
37.97
11
Batas
minimum
2,5%
0.9025
0.841
0.7752
0.6403
0.4802
0.2892
0.1471
0.0564
Median
0.9865
0.9659
0.941
0.9009
0.8425
0.7567
0.6429
0.4902
Batas
maksimum
97,5%
0.9996
0.9972
0.9931
0.988
0.9797
0.967
0.9479
0.9169
Tabel 6. Hasil estimasi Bayesian node Bypass
Node
Mean
Standard
Deviasi
MC error
Bypass[1]
Bypass[2]
Bypass[3]
Bypass[4]
Bypass[5]
Bypass[6]
Bypass[7]
Bypass[8]
0.9532
0.9067
0.855
0.7701
0.6615
0.5194
0.3739
0.2289
0.04703
0.06644
0.08318
0.1131
0.1402
0.1651
0.1697
0.1565
4.48
6.53
8.23
10.3
12.73
14.42
14.65
12.8
( 10 4 )
Batas
minimum
2,5%
0.826
0.7398
0.6548
0.5051
0.357
0.189
0.07959
0.01491
Median
0.9679
0.9224
0.8702
0.7862
0.6743
0.5257
0.366
0.2018
Batas
maksimum
97,5%
0.9988
0.9887
0.9701
0.9398
0.8932
0.8192
0.7175
0.5872
Tabel 7. Hasil estimasi Bayesian parameter Beta
Node
Beta
Mean
-0.8789
Standard
Deviasi
0.9409
MC
error
Median
( 10 )
Batas
Minimum
2,5%
Batas
Maksimum
97,5%
0.01502
-2.919
-0.8126
0.7644
4
Mean dan Median dalam Tabel 5 dan Tabel 6 menunjukkan nilai estimasi
titik. Rata-rata dari parameter dalam Tabel 5 dan Tabel 6 merepresentasikan estimasi
nilai rata-rata posterior untuk pasien yang menggunakan treatment ring dan bypass
yang sekaligus mencerminkan peluang pasien untuk bertahan hidup jika
menggunakan treatment tersebut. Nilai mean yang tertinggi untuk pasien dengan
treatment ring adalah 0.9771 sedangkan dengan bypass 0.953 menunjukkan peluang
bertahan hidup seseorang bertahan dengan menggunakan treatment ring akan
menghasilkan nilai peluang bertahan hidup lebih besar dibandingkan dengan
menggunakan bypass yakni sebesar 0.9771. Nilai error dalam penyusunan MCMC
dengan algoritma Gibbs Sampling ditunjukkan dari MC error, diperoleh nilai error
yang kecil karena mendekati 0. Estimator interval untuk parameter ditunjukkan dari
interval konfidensi yakni batas minimum dan maksimum dengan pengambilan nilai
tingkat sifnifikansi
5 %. Estimasi parameter menunjukkan bahwa semua
12
parameter terletak dalam batas interval konfidensi pada posisi antara 2,50% dan
97,50% dan nilainya signifikan yang tidak melewati nilai nol. Adanya interval
konfidensi tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai ratarata posterior yaitu standar error sekaligus menunjukkan koefisien regresi,
diperoleh ditunjukkan pada Tabel 7 sebesar -0.8789.
Gambar 2. Plot time series untuk MCMC Bayesian dan densitas kernel Ring[1], Bypass[1],
dan beta
Densitas Kerne l-Ring[1]
40
0
20
Ring1
0.85
0.70
Ring1
1.00
MCMC-Ring[1]
0
1000
2000
3000
4000
5000
0.70
Index
0.80
N = 5000
1.00
Bandw idth = 0.00302
Densitas Kerne l-Bypa ss[1]
0
1000
2000
3000
4000
0 5 10
Bypass1
0.8
0.6
Bypass1
1.0
MCMC-Bypa ss[1]
0.90
5000
0.6
Index
0.7
N = 5000
0.9
1.0
Bandw idth = 0.006248
Densitas Kerne l-Beta[1]
0.2
Beta
0.0
-4
Beta
0.4
0 2
MCMC-Beta
0.8
0
1000
2000
3000
4000
5000
-6
Index
-4
N = 5000
-2
0
2
Bandw idth = 0.1484
Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam
Gambar 2. Rantai Markov yang terbentuk ditunjukkan dari garis hitam untuk
MCMC-Ring[1], MCMC-Bypass[1] dan MCMC-Beta. Plot dari time series
menunjukkan gambaran rantai Markov yang dibangkitkan. Updating rantai Markov
sebanyak 10.000 iterasi. Plot Gambar 2. menunjukkan nilai MCMC selalu positif,
hasil plot nampak rapat dan dapat merespon keseluruhan variabel berarti didapati
13
model telah konvergen.
Nilai estimasi densitas posterior dapat dilihat dari plot
dnsitas kernel. Estimasi densitas kernel memberikan plot yang bagus karena
dihasilkan densitas yang cenderung halus. Plot dari parameter beta menunjukkan
bahwa distribusi gambar yang dihasilkan berdistribusi normal. Gambaran MCMC
mengindikasikan bahwa nilai yang ditunjukkan berasal dari sebaran posterior yang
dibentuk oleh rantai Markov.
Gambar 3. Gambaran running quantiles dan autokorelasi
Ring[1]
Bypass[1]
1.0
Bypass[1]
1.0
0.95
0.9
0.85
0.8
0.95
0.9
2500
5000
7500
401
2500
iteration
7500
401
10
20
30
5000
7500
1.0
Se rie s Be ta [5001:10000]
ACF
0.6
0.8
1.0
0.8
0.2
0.0
0.0
0.2
0.4
ACF
0.6
0.8
0.6
0.4
0.2
0.0
0
2500
iteration
Se rie s Bypa ss1[5001:10000]
1.0
Se rie s Ring1[5001:10000]
ACF
5000
iteration
0.4
401
1.0
0.95
0.9
0.85
0.8
0
10
Lag
20
Lag
30
0
10
20
30
Lag
Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan
gambaran mengenai nilai dari gambaran kinerja dari sampel yang bagus karena
ditunjukkan dari posisi plot garis berada di tengah dari batas atas dan bawah. Pada
gambaran running quantiles sumbu horizontal menunjukkan bangkitan rantai
Markov, sedangkan sumbu vertikal menunjukkan nilai estimasi titik nya. Nilai
autokorelasi untuk tiap node dan parameter ditunjukkan pula pada Gambar 3. Nilai
autokorelasi menunjukkan bahwa data yang dibangkitkan memenuhi sifar rantai
14
Markov. Untuk menggambar nilai autokorelasi digunakan fungsi acf pada R i386
3.0.1.
Berdasarkan analisis yang dilakukan diperoleh estimasi parameter beta dari
model Cox-Regresion untuk pasien penderita jantung koroner dengan
Bayesian
menggunakan dua treatment yakni ring dan bypass sebesar -0.8789
sehingga model Cox-Regression dari fungsi survival
S (t; z )
estimasi
0
(t ) exp( 0.8789 z i ) ) dan
exp( 1.824764737) exp(-0.8789z ) .
Kesimpulan
Dalam paper ini diperoleh parameter dari model Cox-Regression untuk data
ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis.
Penelitian ini dapat dikembangkan untuk analisis survival model Weibul dengan
metode Bayesian.
DAFTAR PUSTAKA
[1] Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia
2005. Jakarta
[2] World Health Organization. 2014. The top 10 causes of death. Swiss: WHO.
diakses
pada
Senin
15
September
2014
pukul
9.41.
http://www.who.int/mediacentre/factsheets/fs310/en/
[3] Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada
Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan
SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores.Jurusan
Matematika,
Fakultas
Matematika
dan
Ilmu
Pengetahuan
Alam.UNHAS:Makassar.
[4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.
15
[5] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data.
Universitas Cagliari: Italia.
[6] Subanar,Prof.,Ph.D.2013.Statistika Matematika.Graha Ilmu: Yogyakarta
[7] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan
Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro:
Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[8] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox
Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus. Program
Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[9] Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan MantelHaenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas
Diponegoro : Semarang.
[10] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model
with Changing from the Ba seline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses
pada
Selasa
16
September
2014
pukul
20.12
.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html
[12] Hidayah,Entin. Model Disagregasi Data Hujan Temporal dengan Pendekatan
Bayesian sebagai Input Permodelan Banjir.ITS:Surabaya.
[13] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
.[14] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data. New York. Springer-Verlag New York Inc.
16
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER
MODEL WEIBULL-REGRESSION PADA KASUS KETAHANAN HIDUP
PASIEN PENDERITA JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3
Program Sudi Matematika, Fakultas Sains dan Matematika,
Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
1
[email protected],2 [email protected],
3
[email protected]
ABSTRAK
Paper ini membahas mengenai estimasi parameter model Weibull-Regression
untuk data tersensor pada kasus ketahanan hidup pasien penderita jantung koroner
dengan pendekatan Bayesian survival analysis. Data yang digunakan adalah data
simulasi waktu hidup pasien, status pasien (hidup/mati) dan treatment yang
dikenakan yaitu ring dan bypass. Pendekatan Bayesian (Bayesian approach)
digunakan untuk mencari distribusi posterior parameter.
Metode Markov Chain
Monte Carlo (MCMC) digunakan untuk membangkitkan Rantai Markov guna
mengestimasi parameter meliputi koefisien regresi (  ) dan parameter r dari model
survival Weibull. Parameter  dan r yang diperoleh digunakan untuk menghitung
fungsi survival tiap pasien untuk tiap treatment yang sekaligus menunjukkan
probabilitas bertahan hidup pasien penderita jantung koroner.
Kata Kunci : Survival Analysis, model Weibull-Regression, Bayesian, Markov
Chain Monte Carlo (MCMC)
1
PENDAHULUAN
Pada makalah [1] telah dibahas cara mengestimasi parameter model CoxRegression pada kasus ketahanan hidup pasien penderita jantung koroner [1].
Permodelan data survival dengan menggunakan Bayesian survival analysis
menggunakan Cox-Regression tidak memperhatikan adanya data tersensor.
Kenyataannya, selama proses pengamatan berlangsung terdapat data tersensor
(censored data) yaitu data yang tidak terobservasi secara penuh (not completely
observable) dalam waktu pengamatan [2]. Hal ini berarti selama proses pengamatan
dalam rentang waktu yang ditentukan, terdapat pasien yang belum selesai menjalani
treatment dan waktu hidupnya tetap dicatat dalam pengamatan. Oleh karena itu
untuk mengolah data tersensor digunakan analisis model survival parametrik. Model
yang sering digunakan adalah model Weibull [2]. Distribusi Weibull digunakan
secara efektif untuk menganalisis data waktu hidup khususnya untuk data tersensor
[3]. Fungsi survival distribusi Weibull diestimasi dan digunakan sebagai distribusi
probabilitas untuk data waktu bertahan hidup pasien penderita jantung koroner.
Diasumsikan data yang digunakan termasuk ke dalam Random Censoring.
DASAR TEORI
Data Tersensor
Data tersensor adalah data yang tidak teramati secara penuh (not completely
observable). Biasanya data tersensor ini dijumpai untuk studi observasi dan penelitian
dengan adanya batasan waktu. Terdapat 3 tipe data tersensor yaitu Tersensor tipe I,
Tersensor tipe II dan Random Censoring. Data tersensor tipe I terjadi apabila subjek
berhenti sebelum pemberian waktu sensor. Data tersensor tipe II terjadi apabila
subjek melampaui batas waktu pengamatan dan waktu survivenya catat jika subjek
telah mengalami kegagalan. Random Censoring adalah tipe data tersensor yang sering
terjadi [2].
2
Distribusi Weibull
Distribusi Weibull merupakan distribusi yang sering digunakan dalam analisis
parametrik untuk fungsi survival. Distibusi Weibull banyak digunakan pada aplikasi
di bidang industri maupun biomedis. Realitas yang ditemui untuk bidang engineering
digunakan untuk menggambarkan waktu kegagalan (time to failure) pada barang
elektronik dan sistem mekanik serta untuk memodelkan ketahanan barang elektronik
[3]. Secara umum fungsi kepadatan probabilitas (probability density function) dari
distribusi Weibull adalah:
f (t ) 
r
r
t
r 1
  t r 
exp     dengan r ,   0 dan t  0 .
    
(1)
r
1
Dengan mensubtitusikan     ke dalam persamaan (1) maka diperoleh :
 
f (t )  rt r 1 exp( t r ) .
(2)
Shape parameter dan scale parameter berurutan ditunjukkan oleh nilai r dan  . Scale
parameter (parameter skala) adalah jenis khusus dari parameter numerik yang
menunjukkan besarnya distribusi data. Semakin kecil nilai dari scale arameter maka
distribusi data akan menyebar. Scale parameter (parameter bentuk) adalah jenis
khusus dari parameter numerik yang menunjukkan bentuk dari kurva.
Fungsi
survival untuk distribusi Weibull dapat diperoleh dengan mengintegralkan fungsi
kepadatan probabilitas pada persamaan (1) sehingga

S (t )   f (u )du  exp( t r ).
(3)
t
Laju kegagalan pasien ditunjukkan oleh fungsi hazard (hazard function) dari
distribusi Weibull yaitu:
 0 (t ) 
f (t ) d
 ln S (t )  rt r 1 .
S (t ) dt
(4)
Fungsi hazard kumulatifnya (cumulative hazard function) ditunjukkan seperti di
bawah ini:
3
t
 0 (t )    0 (u )du t r .
(5) [4].
0
Weibull-Regression
Model regresi Weibull untuk distribusi dari fungsi survival dapat dirumuskan
sebagai berikut:
f (t i , z i )  re  ' zi t i
r 1
exp( e  ' zi t i )
r
(6)
dengan mengganti  i  e  ' zi maka persamaan (6) berubah menjadi:
f (t i ,  i )  r i t i
r 1
exp(   i t i )
r
(7)
dengan t i menunjukkan waktu bertahan hidup untuk data pasien yang tersensor
dengan vektor covariate z i [5]. Dalam hal ini r sebagai parameter yang akan
diestimasi nilainya. Distribusi Weibull digunakan karena fleksibel meliputi bentuk
dan model sederhana yang memungkinkan perubahan kenaikan r  1 , penurunan
r  1 dan laju kegagalan yang konstan untuk r  1 [6]. Koefisien regresi dari model
Weibull adalah  yang diperoleh dengan mengasumsikannya sebagai prior yang
berdistribusi normal  ~ N (0,0.0001) . Parameterisasinya Ti ~ Weibull (ri ,  i ) .
Distribusi Prior Model Weibull
Penentuan distribusi prior model Weibull ditentukan dengan mengambil
distribusi yang sering digunakan sebagai standar yaitu Normal N (0,  2 ) dengan nilai
 2 diambil nilai 0.0001 sebagai vague precision untuk model regresi Weibull.
Penentuan distribusi Prior untuk penentuan shape parameter r menggunakan
distribusi Gamma(1,0.0001) untuk fungsi distribusi survival yang turun perlahan pada
saat nilai t  0 (positive real line) [5].
4
Fungsi Likelihood Model Weibull
Fungsi likelihood yang biasa digunakan untuk menganalisis data tersensor adalah
n
L( D | r ,  )   f (t i )  i S (t i )
(1 i )
.
(9)
i 1
Dengan mensubtitusikan f (t i ) diberikan pada persamaan (2) dan S (t i ) pada
persamaan (3) maka diperoleh fungsi likelihood untuk Model Weibull yaitu:
n

L( D | r ,  )   re
i 1
 ' zi
ti
r 1
exp( e
 ' zi
 exp( t )
i
r
ti )
r
(1 i )
(10)
dengan  i  0 jika observasi ke-i tersensor dan  i  1 jika observasi ke-i tidak
tersensor [2].
Aproksimasi Distribusi Posterior
Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat
ditentukan maka distribusi posteriornya dicari dengan cara mengalikan priornya
dengan informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai
berikut:
P ( r ,  | D)  L( D | r ,  ) P ( r ) P (  ) .
(11)
Akan difokuskan dalam mengestimasi parameter r dan  . Karena model rumit
karena mengandung banyak parameter maka distribusi posterior susah untuk
diestimasi secara langsung, maka perlu adanya suatu pendekatan menggunakan
metode simulasi dengan MCMC (Markov Chain Monte Carlo). Pada proses MCMC
dipilih menggunakan algoritma Gibbs Sampling.
Algoritma Gibbs Sampling dalam winBUGS membutuhkan nilai awal dari
parameter yang akan di estimasi. Nilai awal ditentukan yaitu  ~ Normal (0,0.0001)
(
) . Langkah manual penyusunan algoritma Gibbs Sampling
dan r ~Gamma 1,0.0001
dibuat dengan prosedur penentuan ( P(r | D,  ), P(r | D,  )) dengan langkah pada
persamaan (12) dan (13) yaitu:
P( | D, r )  P( ) L( D | r ,  )
dan
5
(12)
P(r | D,  )  P(r ) L( D | r ,  ) .
(13)
Langkah pada persamaan (12) dan (13) diulang sebanyak bilangan B yang cukup
besar, dengan B merupakan banyaknya update pada software WinBUGS 1.4 yaitu
proses iterasi guna menyusun rantai Markov hingga diperoleh deret rantai Markov
yang konvergen.
METODE PENELITIAN
Profil data
Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan
treatment yang digunakan pasien penderita jantung koroner [4]. Kemudian dilakukan
simulasi dengan menambah data yang tersensor. Data survival ditunjukkan pada
Tabel 1 dengan banyaknya pasien sejumlah 40 pasien dan dua treatment yang
dikenakan yaitu treatment Ring dan Bypass. Dalam hal ini tanda * menunjukkan data
yang tersensor. Banyaknya data yang tersensor untuk treatment Ring sebanyak 1
pasien dan untuk treatment Bypass sebanyak 7 pasien. Status hidup pasien bernilai 0
menunjukkan pasien tetap bertahan hidup saat menjalani treatment dan bernilai 1
menunjukkan pasien meninggal saat proses treatment berlangsung
Langkah-langkah penelitian
Pengolahan data dengan menggunakan winBUGS 1.4. Sspesifikasi model
meliputi pengecekan terhadap syntax model, loading data, compiling model,
inisialisasi model, menentukan iterasi MCMC sebanyak 200.000 kali guna
membangkitkan Rantai-Markov hingga mencapai konvergen.
Parameter
yang
akan diestimasi meliputi treatment ring, bypass serta parameter distribusi Weibull r.
Updating data parameter ditentukan sebanyak 200.000 titik sampel. Dalam ploting
masing-masing node dan parameter beta nilai rantai Markov dilakukan burn in
sebanyak 100.000 data, dan diambil bangkitan rantai dari data ke 100.001 sampai
dengan 200.000 titik sampel.
6
Tabel 1. Data survival pasien penderita jantung koroner
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Waktu
(bulan)
26
26
38
51
52
56
57
61
62
62
66
71
71
75
83
106
123
128*
156
183
Status
Treatment
No
0
0
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Waktu
(bulan)
32
33
42
42
56
56*
60*
65
78
87
87*
93
102*
116*
116*
146*
161
173
178
182
Status
Treatment
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
1
0
1
1
1
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
HASIL DAN PEMBAHASAN
Dalam proses analisis data yang terdiri dari N  40 dan M  2 , dengan N
menyatakan total pasien penderita penyakit jantung koroner dan M menunjukkan
banyaknya treatment yang digunakan oleh pasien meliputi metode pengobatan Ring
dan Bypass.
Weibull-Regresion menggunakan pendekatan Bayesian dilakukan dengan
update untuk menyusun MCMC dengan iterasi sebanyak 200.000 titik sampel. Hasil
nilai estimasi dan karakteristik untuk masing-masing parameter ditunjukkan pada
Tabel 2 dan Tabel 3.
7
Tabel 2. Hasil estimasi Bayesian untuk parameter  node Ring dan Bypass
Node
Mean
Standard
Deviasi
Ring
Bypass
-8.936
-0.7868
1.248
0.3685
MC
error
Batas
minimum 2,5%
Median
0.02904
0.00155
-11.51
-1.524
-8.889
-0.7821
Batas
maksimum
97,5%
-6.627
-0.07581
Tabel 3. Hasil estimasi Bayesian untuk parameter r
Node
Mean
Standard
Deviasi
r
1.98
0.2609
MC
error
0.00612
Batas
Minimum
2,5%
1.493
Median
1.972
Batas
Maksimum
97,5%
2.515
Tabel 4. Probabilitas tiap pasien untuk masing-masing treatment
S(t)
No
Waktu
(bulan)
S(t)
Treatment
No
Waktu
(bulan)
1  10 125
Treatment
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
26
26
38
51
52
56
57
61
62
62
66
71
71
75
83
106
123
128*
156
183
0.9200
0.9200
0.8381
0.7288
0.7198
0.6834
0.6742
0.6370
0.6277
0.6277
0.5904
0.5439
0.5439
0.5072
0.4362
0.2601
0.1640
0.1414
0.0553
0.0189
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
32
33
42
42
56
56*
60*
65
78
87
87*
93
102*
116*
116*
146*
161
173
178
182
0.5810
0.5810
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
8
Pada [1] telah diperoleh satu nilai estimasi parameter  model CoxRegression untuk kedua teknik pengobatan Ring dan Bypass yaitu sebesar -0.8789
[1]. Pada model Weibull-Regression didapatkan dua nilai parameter  untuk
treatment Ring dan Bypass berurutan sebesar -8.936 dan -0.7868. Probabilitas tiap
pasien untuk masing-masing treatment ditunjukkan pada Tabel 4. Nilai probabiitas
tertinggi untuk pasien menggunakan treatment Ring adalah 0.9200 dan yang terendah
adalah 0.0189. Sedangkan untuk treatment bypass diperoleh nilai probabilitas yang
sangat kecil. Pebandingan nilai probabilitas ketahanan hidup pasien penderita jantung
koroner untuk model Cox-Regression dan Weibull-Regression ditunjukkan pada
Tabel 5. Dari Tabel 5. Terlihat nilai probabilitas bertahan hidup pasien dengan
menggunakan Weibull-Regression jauh lebih kecil jika dibandingkan dengan model
Cox-Regression. Nilai probabilitas fungsi survival yang bernilai 0 diduga karena
model Weibull-Regression kurang sesuai untuk mengestimasi parameter ktahanan
hidup pasien penderita jantung koroner.
Tabel 5. Probabilitas survival untuk model Cox-Regression dan Weibull-Regression
Pasien ke 8
12
27
35
36
38
39
40
Waktu
(bulan)
61
71
60
116
146
173
178
182
S(t)
S(t)
Cox-Regression
Weibull-Regression
Status
Pasien
0.9771
0.9536
0.9262
0.8781
0.8119
0.7185
0.6130
0.4868
0.6370
0.5439
0
0
0
0
0
0
1
1
1
1
1
1
1
1
Mean dan Median dalam Tabel 2 menunjukkan nilai estimasi titik untuk nilai
parameter  . Rata-rata dari parameter dalam Tabel 2 merepresentasikan estimasi
nilai rata-rata posterior untuk pasien yang menggunakan ring dan bypass
menggunakan kedua treatment tersebut. Nilai mean untuk pasien dengan ring adalah
-8.936 sedangkan dengan bypass -0.7868. Nilai error dalam penyusunan MCMC
dengan algoritma Gibbs Sampling ditunjukkan dari MC error, diperoleh nilai error
9
yang cukup kecil karena mendekati nol. Estimator
interval untuk parameter
ditunjukkan dari interval konfidensi yakni batas minimum dan maksimum dengan
pengambilan nilai   0,5 . Estimasi parameter menunjukkan bahwa semua parameter
terletak dalam batas interval konfidensi pada posisi antara 2,50% dan 97,50% dan
nilainya signifikan karena tidak melewati nilai nol. Adanya interval konfidensi
tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai dari koefisien
regresi  ditunjukkan dari nilai mean dari ring dan bypass.
Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam
Gambar 1. Plot dari time series menunjukkan gambaran rantai Markov yang
dibangkitkan dari data dengan updating sebanyak 200.000 iterasi.
Gambar 1. Plotime series untuk MCMC Bayesian dan densitas kernel node Ring, node
Bypass, dan r
Densitas Kernel beta-Ring
0.00
0.15
Ring1
-10
-14
Ring
-6
0.30
MCMC-Ring
0e+00
4e+04
8e+04
-14
Index
-12
N = 100000
-8
-6
-4
Bandw idth = 0.1109
Densitas Kernel beta-Bypass
0.8
0.0
0.4
Bypass
-1.0
-2.5
Bypass
0.5
MCMC-Bypass
-10
0e+00
4e+04
8e+04
-3
Index
-2
N = 100000
0
Bandw idth = 0.03327
Densitas Kernel-r
1.0
0.0
r
2.0
1.0
r
3.0
MCMC-r
-1
0e+00
4e+04
8e+04
1.0
Index
1.5
N = 100000
10
2.0
2.5
3.0
Bandw idth = 0.02319
Plot Gambar 1. menunjukkan nilai MCMC tidak selalu positif, hasil plot
nampak rapat dan dapat merespon keseluruhan sampel berarti didapati model telah
konvergen. Nilai estimasi densitas posterior dapat dilihat dari plot densitas kernel.
Estimasi densitas kernel memberikan plot yang bagus karena dihasilkan densitas yang
cenderung halus. Plot dari densitas kernel untuk setiap node Ring dan Bypass
mengikuti densitas prior yakni berdistribusi normal sedangkan untuk parameter r juga
cenderung normal. Gambaran MCMC mengindikasikan bahwa nilai yang
ditunjukkan berasal dari sebaran posterior yang dibentuk oleh rantai Markov.
Gambar 3. Gambaran running quantiles dan autokorelasi
ring
r
bypass
-6.0
0.0
-8.0
-0.5
-10.0
-1.0
-12.0
-1.5
8001 50000 100000 150000
3.0
2.5
2.0
1.5
8001 50000 100000 150000
8001 50000 100000 150000
iteration
0
10
30
Lag
50
0.8
1.0
Series r[100001:2e+05]
0.0
0.2
0.4
ACF
0.6
0.8
0.6
0.4
0.2
0.0
0.0
0.2
0.4
ACF
0.6
0.8
1.0
Series bypass[100001:2e+05]
1.0
Series ring[100001:2e+05]
ACF
iteration
iteration
0
10
30
Lag
50
0
10
30
50
Lag
Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan
gambaran mengenai nilai dari kinerja sampel yang cukup bagus. Hal tersebut
ditunjukkan dari posisi plot garis yang masih terletak di dalam rentang interval yaitu
diantara batas atas dan bawah. Gambaran nilai autokorelasi untuk tiap node dan
11
parameter ditunjukkan pula pada Gambar 3. Nilai autokorelasi menunjukkan bahwa
data yang dibangkitkan memenuhi sifar rantai Markov [8]. Plot nilai autokorelasi
dengan menggunakan fungsi acf pada R i386 3.0.1. ACF merupakan singkatan dari
Auto Corelation Function. Nilai autokorelasi untuk ring dan r kuat ditunjukkan dari
plot autokorelasi yang turun secra perlahanan, Sedangkan untuk node bypass tidak
sekuat nilai autokorelasi untuk ring dan r. Hal tersebut terlihat dari plot autokorelasi
yang turun tajam.
Berdasarkan analisis yang dilakukan diperoleh nilai estimasi parameter 
dan r dari model Weibull-Regresion untuk pasien penderita jantung koroner.
Kesimpulan
Dalam paper ini diperoleh nilai parameter  dan r serta nilai probabilitas
bertahan hidup pada model Weibull-Regression untuk mengolah data tersensor
ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis.
DAFTAR PUSTAKA
[1] Lukitasari, A.Dewi, Adi Setiawan dan Leopoldus Ricky Sasongko.2014.
Bayesian Survival Analysis menggunakan Cox-Regression untuk Mengestimasi
Model Ketahanan Hidup Pasien Penderita Jantung Koroner. Prosiding Seminar
Nasional Sains dan Pendidikan Sains. Universitas Muhammadiyah : Purworejo.
[2] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data.
Fakultas Matematika dan Informatika. Universitas Cagliari: Italia.
[3] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data. New York. Springer-Verlag New York Inc.
[4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.
[5] Andrew E Long. 1999. Weibull Regression in Censored Survival Analysis.
Diakses pada Selasa, 16 Desember 2014 pukul 14:02.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node27.html
12
[6] Thamrin, Sri Astuti.2013.Bayesian Survival Analysis Using Gene
Expression.Fakultas Sains dan Teknik.Universitas Teknologi Queensland :
Australia.
[7] Subanar.2013.Statistika Matematika.Graha Ilmu: Yogyakarta.
[8] Hidayah,Entin.2013.Model Disagregasi Data Hujan Temporal
Pendekatan Bayesian sebagai Input Permodelan Banjir.ITS:Surabaya.
dengan
[9] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan Metode
Bayes Menggunakan Prior Konjugat. Universitas Diponegoro: Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[10]
Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi
Cox Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus.
Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[11] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
[12] Mustafa, Ayman dan Anis Ben Ghorbal.2011.Using WinBUGS to Cox Model
with Changing from the Ba seline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
13
Lampiran 1
Data survival pasien penderita jantung koroner
No
Waktu
(bulan)
Status
Treatment
No
Waktu
(bulan)
Status
Treatment
1
26
0
Ring
21
32
0
Bypass
2
26
0
Ring
22
33
0
Bypass
3
38
0
Ring
23
42
0
Bypass
4
51
0
Ring
24
42
0
Bypass
5
52
0
Ring
25
56
0
Bypass
6
56
0
Ring
26
56*
0
Bypass
7
57
0
Ring
27
60*
1
Bypass
8
61
1
Ring
28
65
0
Bypass
9
62
0
Ring
29
78
0
Bypass
10
62
0
Ring
30
87
0
Bypass
11
66
0
Ring
31
87*
0
Bypass
12
71
1
Ring
32
93
0
Bypass
13
71
0
Ring
33
102*
0
Bypass
14
75
0
Ring
34
116*
0
Bypass
15
83
0
Ring
35
116*
1
Bypass
16
106
0
Ring
36
146*
1
Bypass
17
123
0
Ring
37
161
0
Bypass
18
128*
0
Ring
38
173
1
Bypass
19
156
0
Ring
39
178
1
Bypass
20
183
0
Ring
40
182
1
Bypass
xvi
Lampiran 2
Program WINBUGS 1.4 untuk Bayesian Survival Analysis menggunakan CoxRegression
#Program WINBUGS 1.4 untuk model Cox-Regression data survival pasien
penderita jantung koroner
model jantung;
const
N =40, # number of patients
T = 8, # number of unique failure times
eps = 0.000001; # used to guard against numerical
# imprecision in step function
var
obs.t[N], # observed failure or censoring time for
each patient
t[T+1], # unique failure times + maximum censoring
time
dN[N,T], # counting process increment
Y[N,T], # 1=subject observed; 0=not observed
Idt[N,T], # intensity process
Z[N], # covariate
beta, # regression coefficient
dL0[T], # increment in unknown hazard function
beta0[T], # log(increment in unknown hazard
function)
dL0.star[T], # prior guess at hazard function
c, # degree of confidence in prior guess for
dL0
mu[T], # location parameter for Gamma (= c *
dL0.star)
r, # prior guess at failure rate
fail[N], # failure = 1; censored = 0
Ring[T], # survivor function for ring group
Bypass[T]; # survivor function for bypass group
{
# Set up data
for(i in 1:N) {
for(j in 1:T) {
# risk set = 1 if obs.t >= t
xvii
Y[i,j] <- step(obs.t[i] - t[j] + eps);
# counting process jump = 1 if obs.t in [ t[j],
t[j+1] )
#
i.e. if t[j] <= obs.t < t[j+1]
dN[i,j] <- Y[i,j]*step(t[j+1] - obs.t[i] eps)*fail[i];
}
}
# Model
for(j in 1:T) {
#
beta0[j] ~ dnorm(0,0.001); # include this when using
Poisson trick
for(i in 1:N) {
dN[i,j]
~ dpois(Idt[i,j]);
# Likelihood
Idt[i,j] <- Y[i,j]*exp(beta*Z[i])*dL0[j]; # Intensity
# Try Poisson trick - independent log-normal hazard
increments
#
- enables dL0, c, r, mu to be
dropped from model
# Idt[i,j] <- Y[i,j]*exp(beta0[j]+beta*Z[i]); #
Intensity
}
dL0[j] ~ dgamma(mu[j], c);
mu[j] <- dL0.star[j] * c;
# prior mean hazard
# Survivor function = exp(Integral{l0(u)du})^exp(beta*z)
Ring[j] <- pow(exp(-sum(dL0[1:j])), exp(beta * -0.5));
Bypass[j] <- pow(exp(-sum(dL0[1:j])), exp(beta * 0.5));
}
c <- 0.001; r <-0.1;
for (j in 1:T) {
dL0.star[j] <- r * (t[j+1]-t[j])
xviii
}
beta ~ dnorm(0.0,0.000001);
}
#List data pasien penderita jantung koroner
list(N=60, T=8, eps = 1.0E-10,
obs.t=c(6,7,7,8,11,17,20,21,21,25,26,26,38,51,52,56,
57,61,62,62,66,71,71,75,83,106,123,128,156,183,6,6,7,12,1
2,16,17,17,21,26,32,33,42,42,56,56,60,65,78,87,87,93,102,
116,116,146,161,173,178,182),
fail=c(0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0
,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,
0,0,0,1,1,0,1,1,1),
Z=c(0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,
0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0.5,0
.5,0.5,0.5,0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,-0.5,0.5,-0.5,-0.5,-0.5,-0.5,-0.5,
-0.5,-0.5,-0.5,-0.5,0.5),t=c(60,61,71,116,146,173,178,182,183))
#inisialisasi untuk treatment ring dan bypass
list( beta = 0.0,
dL0 = c(1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0))
xix
Lampiran 3
Program WINBUGS 1.4 untuk Bayesian Survival Analysis menggunakan
Weibull-Regression
#Program WINBUGS 1.4 untuk model Weibull-Regression data survival pasien
penderita jantung koroner
model
{
for(i in 1 : M) {
for(j in 1 : N) {
t[i, j] ~ dweib(r, mu[i])I(t.cen[i,
j],)
}
mu[i] <- exp(beta[i])
beta[i] ~ dnorm(0.0, 0.001)
median[i] <- pow(log(2) * exp(-beta[i]),
1/r)
}
r ~ dexp(0.001)
ring <-beta[1]
bypass <- beta[2] - beta[1]
}
#List untuk data simulasi pasien penderita jantung koroner
list(t
=
structure(.Data=c(26,26,38,51,52,56,57,61,62,62,
66,71,71,75,83,106,123,NA,156,183,32,33,42,42,56,NA,NA,65
,78,87,NA,93,NA,NA,NA,NA,161,173,178,182),.Dim
=
c(2,20)),
t.cen=structure(.Data=c(0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,128,0,0,0,0,0,0,0,56,60,0,0,0,87,0,102,116,116,146,
0,0,0,0),.Dim = c(2,20)),M = 2, N = 40)
#Inisialisasi
list(beta = c(0,0), r = 2)
#Keterangan
N =40, # number of patients
M = 2 #number of treatment; NA = waktu data tersensor
xx
Lampiran 4
Manual penggunaan WINBUGS 1.4
1. Buka software WINBUGS 1.4 sehingga muncul tampilan sebagai berikut
2. Open file yang akan dirunning dengan klik file  open, dilanjutkan dengan
memilih file yang telah berisi model, data dan inisialisi.
xxi
3. Mengecek model dengan klik model  specification sehinga muncul kotak
dialog sebagai berikut
4. Lakukan cek model dengan mengeblok kata model kemudian pilih check
model
xxii
5. Loading data dilakukan dengan cara blok list data kemudian pilih load data
6. Compiling model dilakukan dengan klik compile
xxiii
7. Lakukan inisialisasi dengan cara blok list inisialisasi data kemudian pilih load
inits dan klik gene inits
8. Lanjutkan dengan setting sample yaitu pilih menu interface  sample akan
muncul kotak dialog sample monitor tool
xxiv
9. Lakukan paramerisasi dengan cara set parameter . meliputi ring, bypass dan r
10. Lakukan updating MCMC dengan pilih menu model  update, isi kolom
updates sebanyak 200.000 titik sesuai banyaknya titik sampel rantai Markov
yang ingin dibangkitkan. Tunggu hingga update MCMC selesai.
xxv
11. Pada kolom node di sample monitor tool, isi dengan * (untuk memunculkan
semua node yang telah di set). Untuk mencari statistik dari parameter pilih
stats maka akan muncul statistik dari keseluruhan parameter yang telah di set.
12. Untuk menampilkan gambaran rantai Markov klik history
xxvi
13. Untuk menggambar kuantil klik quantiles
xxvii
Lampiran 6
Sertifikat Publikasi
xxviii
Download