Analisis Survival dengan Regresi Cox BAB I PENGERTIAN 1. Definisi Analisis survival merupakan serangkaian metode untuk menganalisis data di mana variabel outcome yang diteliti adalah waktu munculnya suatu kejadian. Kejadian yang dimaksud bisa berupa kematian, munculnya penyakit, pernikahan, perceraian, dan sebagainya. Contohnya, apabila kejadian yang akan diteliti adalah serangan jantung, maka survival time dapat berupa waktu dalam tahun hingga seseorang mengalami serangan jantung. Tidak seperti model regresi biasa, metode analisis survival menggabungkan dengan tepat informasi dari observasi censored dan uncensored dalam mengestimasi parameter model penting. Variabel dependen dalam analisis survival terdiri dari dua bagian: waktu terjadinya kejadian dan status kejadian, yang mencatat apakah kejadian yang diteliti muncul atau tidak. Peneliti dapat meng-estimasi dua fungsi yang bergantung pada waktu, yaitu fungsi survival dan fungsi hazard. Dua hal ini adalah konsep kunci dalam analisis survival untuk menggambarkan distribusi kejadian. Fungsi survival memberi probabilitas survival (atau tidak mengalami kejadian). Fungsi hazard memberi potensi munculnya kejadian per satuan waktu, mengingat seseorang telah bertahan (survive) sampai waktu tertentu. Biasanya tujuan studi survival adalah untuk menjelaskan hubungan antara faktor yang diteliti dengan waktu munculnya kejadian, dengan adanya beberapa kovariat seperti umur, jenis kelamin, ras, dan lain sebagainya. Beberapa model tersedia untuk menganalisis hubungan antara serangkaian variabel prediktor dengan waktu survival, termasuk di antara metode parametrik, nonparametrik, dan semiparametrik. Metode parametrik mengasumsikan distribusi yang mendasari waktu survival mengikuti distribusi probabilitas tertentu yang telah diketahui. Metode parametrik yang populer termasuk metode eksponensial, Weibull, dan distribusi lognormal. Deskripsi dari distribusi waktu survival dan perubahan dalam distribusi fungsi prediktor merupakan faktor yang ingin diteliti. Parameter model dalam pengaturan ini biasanya diestimasi menggunakan modifikasi yang sesuai dari maximum likelihood Estimasi nonparametrik dari fungsi survival, yaitu metode Kaplan Meier lebih sering digunakan untuk mengestimasi dan menggambarkan probabilitas survival sebagai fungsi waktu. Ini digunakan untuk memperoleh statistik deskriptif univariat untuk data survival, termasuk median waktu survival, dan membandingkan pengalaman survival dari dua atau lebih kelompok subyek. Untuk menguji perbedaan keseluruhan antara kurva estimasi survival antara dua kelompok subjek atau lebih, seperti pria dan wanita, atau keleompok perlakuan dengan kelompok tanpa perlakuan (kontrol), beberapa uji tersedia, di antaranya dengan log-rank tes. Ini serupa dengan uji chi square, digunakan secara luas dalam praktiknya, dan pada kenyataannya ini merupakan sebuah metode untuk membandingkan kurva estimasi Kaplan Meier untuk setiap grup subjek. Sebuah model regresi yang populer untuk analisis survival adalah Cox proportional hazard regression model. Ini memungkinkan pengujian perbedaan waktu survival pada dua kelompok atau lebih yang diteliti, dan tetap memungkinkan penyesuaian kovariat yang diteliti. Cox regression model merupakan model semiparametrik, dengan asumsi yang lebih sedikit daripada metode parametrik namun dengan asumsi yang lebih banyak daripada metode nonparametrik. Secara khusus, dan tidak seperti metode parametrik, cox regression model tidak memiliki asumsi tentang bentuk baseline hazard function. Cox regression model lebih berguna dan lebih mudah untuk menginterpretasikan informasi berkaitan dengan hubungan antara hazard function dengan prediktor. Sementara hubungan nonlinear antara hazard function dan prediktor diasumsi, hazard ratio yang membandingkan dua observasi bersifat konstan sepanjang waktu di mana pengaturan variabel prediktor tidak berubah-ubah sepanjang waktu. Asumso ini disebut asumsi proportional hazard dan memastikan bahwa asumsi ini terpenuhi merupakan bagian yang penting dalam analisis regresi cox. Ini merupakan model data survival yang paling populer dan diimplementasikan dalam banyak software statistik. 2. Penggunaan Analisis survival digunakan pada keadaan di mana faktor “kapan terjadinya suatu kejadian” lebih penting daripada “apakah suatu kejadian terjadi atau tidak”. Dengan kata lain, kita harus menggunakan analisis survival bila kita peduli dengan “waktu terjadinya suatu kejadian”. 3. Terminologi a. Sumbu y, sumbu x, dan garis survival Sumbu y pada kurva survival menunjukkan persentase survival, yaitu persentase subyek yang masih bertahan/ bebas dari kejadian yang sedang diamati. Sumbu x pada kurva survival menunjukkan waktu. Garis berkelokkelok adalah garis survival. b. Survival rate untuk waktu-waktu tertentu Survival rate untuk waktu tertentu bisa diketahui dengan menarik garis vertikal dari waktu tertentu pada sumbu x sampai memotong garis survival. c. Median survival Median survival adalah waktu di mana 50% subyek mengalami event. Median survival bisa diketahui dengan menarik garis horizontal dari sumbu y pada titik 50% sampai memotong garis survival. Informasi median survival ini bermanfaat untuk menghitung besar sampel dalam penelitian dengan analisis survival. d. Asumsi proporsional hazard Proporsional hazard (PH) artinya perbandingan kecepatan terjadinya suatu kejadian antar kelompok setiap saat adalah sama. Ciri dari suatu kurva survival yang memenuhi asumsi PH adalah garis survival antar kelompok tidak saling berpotongan. Asumsi PH sangat penting dalam analisis survival. Pentingnya asumsi ini analog dengan asumsi normalitas data pada analisis parametrik. Analisis yang dilakukan pada suatu fungsi survival yang memenuhi asumsi PH berbeda dengan analisis yang dilakukan pada fungsi survival yang tidak memenuhi asumsi PH. Survival yang memenuhi asumsi PH akan dianalisis dengan time independent analysis sementara survival yang tidak memenuhi asumsi PH akan dianalisis dengan analisis full model atau analisis reduced model. e. Hazard rasio Salah satu parameter yang penting dalam analisis survival adalah rasio hazard atau hazard ratio (HR). Nama lain dari HR adalah insidens rate. Apabila kita membandinga dua hazard, maka yang akan kita peroleh adalah hazard rasio. Sedangkan bila kita membandingan dua insidens, maka yang akan kita peroleh adalah resiko relatif (RR). 4. Rumus-rumus 5. Asumsi (Syarat dan ketentuan/ conditions) 6. Cara Menghitung LANGKAH-LANGKAH ANALISIS SURVIVAL Analisis survival terdiri dari tiga langkah utama, yaitu pengecekan asumsi proporsional hazard, analisis bivariat, dan analisis multivariat 1. Pengecekan asumsi PH Pada analisis survival, pengecekan asumsi PH adalah langkah yang penting karena akan menentukan jenis analisa apa yang akan digunakan. Prosedur pengecekan PH dilakukan dengan tiga metode yaitu metode Kapplan Meier, metode in in survival, dan metode global test. a. Metode Kapplan Meier Untuk mengetahui apakah fungski survival memenuhi asumsi PH, maka buatlah kurva Kapplan Meier. Apabila garis survival tidak berpotongan, maka asumsi PH berdasarkan metode Kapplan Meier terpenuhi. b. Metode –In in Survival Langkah-langkah yang dilakukan adalah sebagai berikut: - Klik statistics - Pilih survival analysis - Pilih regression model - Pilih graphically asses proportional hazard assumption - Masukkan variabel yang diteliti ke dalam kotak independent variable - Klik OK Selanjutnya akan muncul grafik garis survival. Apabila garisnya tidak berpotongan, maka asumsi PH berdasarkan metode –In In Survival terpenuhi. c. Metode Global Test Apabila nilai p pada uji global test lebih besar dari 0,05, maka asumsi PH telah terpenuhi. Mungkin terdapat beberapa variabel yang memenuhi asumsi PH dan beberapa variabel tidak memenuhi asumsi PH. Perlakukan pada variabel yang memenuhi asumsi PH berbeda dengan variabel yang tidak memenuhi asumsi PH. 2. Analisis bivariat Untuk variabel yang memenuhi asumsi PH, analisis bivariat dilakukan dengan analisis cox regression. 3. Analisis multivariat Variabel yang masuk analisis multivariat adalah variabel yang pada analisis bivariat mempunyai nilai p<0,25. Selain itu, variabel yang tidak memenuhi asumsi PH dan secara teoritis penting, harus dimasukkan ke dalam analisis multivariat. Bila semua variabel memenuhi asumsi PH, maka analisis multivariat yang dipilih adalah analisis time independent cox regression. Apabila terdapat variabel yang tidak memenuhi asumsi PH, maka dapat dilakukan analisis cox regression full model atau cox regression reduced model 4. Interpretasi hasil Setelah menyelesaikan analisis survival, kita melakukan interpretasi hasil. Beberapa hal yang dapat kita simpulkan dari analisis survival adalah sebagai berikut: a. Variabel yang berhubungan dengan variabel tergantung dengan melihat nilai p dan interval kepercayaan dari HR pada masing-masing variabel. Dikatakan berhubungan jika nilai p kurang dari 0,05 dan pada interval kepercayaan tidak ada ngka 1 b. Urutan kekuatan dari variabel-variabel yang berhubungan dengan variabel tergantung. Pada analisis survival, urutan kekuatan dilihat dari besarnya nilai HR c. Model atau rumus untuk memprediksikan hazard function dan survival function. Untuk hazard function, rumusnya adalah: H(t) = H0(t) ey H(t) = hazard pada waktu tertentu H0(t) = baseline hazard pada waktu tertentu Y = b1x1+ b2x2 + b3x3 + ....... + bnxn Untuk survival function, rumusnya adalah: S(t) = S0(t)(e^y) S(t) = survival pada waktu tertentu S0(t) – baseline survival pada waktu tertentu Y = b1x1+ b2x2 + b3x3 + ....... + bnxn 5. Mengaplikasikan persamaan yang diperoleh untuk menghitung hazard dan probabilitas pasien BAB II Contoh Penggunaan 1. Manual 2. Dengan Software 3. Interpretasi Hasil BAB III Presentasi Powerpoint