ARTIKEL PENELITIAN Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri ABSTRACT Background: Outcome prediction is important both in clinical and administrative Intensive Care Unit (ICU) management. A good scoring system will be able to predict an acurate prognosis for the patients who admitted to ICU. Objective: To estimate the accuracy of the scoring system, a validation in the discrimination and calibration of the scoring system is being done. Methods: The research was enrolled in 132 patients who admitted to Intensive Care Unit Dr. Hasan Sadikin Hospital Bandung from 7th of July until 20th October 2008. All patients were scored using the APACHE II and SOFA score, and probability of death (POD) of both score during the first 24 hours, and outcome at the end of the treatment period whether the patients live or die. The data from this research were statistically tested using Mann-Whitney, a regression analysis was to consider the relationship between APACHE II score and SOFA score with the outcome and to find out the cut off point for the APACHE II and SOFA score based on the ROC curve, than to see the sensitivity, specificity, acuracy and the value of AuROC. The p<0,05 is considered meaningful for the statistic test. Calibration is done using Lameshow – Hosmer Goodness of fit. Result: The result showed that a Rank Spearman coefisient correlation for scores and POD between Departemen Anestesiologi dan Reanimasi Fakultas Kedokteran Universitas Padjadjaran Bandung Jl. Pasteur No. 38, Bandung 40161 Korespondensi : [email protected] Volume 2 Nomor 1 Januari 2012 APACHE II and SOFA with p<0,001, which is significantly meaningful. Area under receiver operating characteristic (AuROC) APACHE II score is 0,912 and AuROC for SOFA is 0,951. A calibration for APACHE II score is p=0,239, with the chiquadrat=5,506, whereas for SOFA score p=0,450 with the chi-quadrat = 2,641. Conclusion: SOFA score is more accurate in predicting outcome of the patients in the ICU Dr. Hasan Sadikin Hospital, Bandung. it’s had a better validation (discrimination and calibration) in comparisson the APACHE II score. (Maj Ked Ter Intensif. 2012; 2(1): 11 - 20) Key words: APACHE II score with, SOFA score, validation, discrimination, calibration, AuROC. PENDAHULUAN Memperkirakan mortalitas pasien dari ruang perawatan intensif atau Intensive Care Unit (ICU) sangat penting, baik secara klinik maupun administrasi. Prediksi mortalitas pasien bukanlah merupakan penilaian kinerja ICU, tetapi memperkirakan pasien saat keluar dari ICU dapat membantu memantau keadaan pasien dan membantu memberikan informasi mengenai kelanjutan dari pasien yang berhubungan dengan keadaan penyakit pasien dan dapat dijadikan panduan untuk keputusan terapi selanjutnya pada pasien. Pada saat ini tersedia beberapa model berupa sistem penilaian yang dapat digunakan untuk memperkirakan mortalitas pasien, seperti Acute Physiology and Chronic Health Evaluation (APACHE), Simplified Acute Physiology Score (SAPS), Mortality Probability Models (MPM), 11 Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif Sequential Organ Failure Assessment (SOFA), Multi Organ Dysfunction Score (MODS), dan Logistic Organ Dysfungtion Score (LODS), yang dinilai dan dihitung pada 24 jam pertama pasien dirawat di ICU. Banyak faktor yang dapat mempengaruhi pasien selama dirawat di ICU. Oleh karenanya, diperlukan penilaian lain yang dapat mengevaluasi perubahan pada pasien selama dirawat dan tetap berdasarkan model-model penilaian yang telah ada.6 Kegagalan organ berhubungan dengan tingginya angka mortalitas dan morbiditas pasien di ICU dan tingginya biaya yang harus dikeluarkan. Disfungsi organ adalah proses yang dinamis oleh karena itu, evaluasi disfungsi organ setiap waktu selama perawatan di ICU sangat membantu dalam mengikuti perkembangan penyakit dan dapat memberikan gambaran korelasi yang kuat dengan hasil akhir dari perawatan di ICU. Disfungsi organ sangat berhubungan dengan tingginya angka kesakitan dan mortalitas pada pasien ICU dan juga berkaitan dengan tingginya biaya di ICU.6,9 Sejumlah parameter fisiologi digunakan untuk mendefinisikan disfungsi organ, yaitu paru-paru, kardiovaskular, ginjal, hati, hematologi, dan sistem saraf pusat adalah organ yang umumnya digunakan untuk penilaian dari disfungsi atau gagal organ pada pasien yang dirawat di ICU. Pada tahun 1980 diajukan definisi empat gagal organ sistem (system of four organ failures) untuk pasienpasien bedah yaitu paru-paru, hati, gastrointestinal, dan ginjal. Peneliti lain mendefinisikan gagal sistem organ (organ system failure) untuk lima sistem organ, yaitu kardiovaskular, paru-paru, ginjal, hematologi, dan gagal sistem neurologi. Ada juga yang mendasarkan penilaian pada tujuh sistem organ yang dinilai dalam tiga kategori, yakni 0 = fungsi organ normal, 1= disfungsi organ, dan 2 = gagal organ. Pada tahun 1993 dimasukkan infeksi dalam definisi disfungsi organ.4 Sistem penilaian untuk disfungsi organ atau kegagalan fungsi organ dirancang terutama sebagai perangkat deskriptif yang ditujukan dalam menetapkan suatu standardisasi definisi. 7,11 Manfaat sistem penilaian adalah untuk menilai prognosis pasien, menilai kualitas pelayanan ICU, dan dapat membuat homogenitas sampel pada suatu penelitian di ICU.12 Suatu sistem penilaian yang baik dapat memperkirakan prognosis pasien yang akurat, dan akan membantu klinisi dalam melakukan triase atau pemilahan pasien dan mengambil keputusan kelanjutan terapi pasien, apakah akan dihentikan terapinya (withdrawing) atau tidak akan ditingkatkan terapinya (withholding) atau terapi akan tetap diteruskan.13 12 Penggunaan sistem penilaian sebagai alat bantu dalam mengambil keputusan merupakan hal yang logis dan dianjurkan, tetapi sebaiknya memilih sistem penilaian yang sudah tervalidasi baik.14,15 APACHE II score mempunyai korelasi yang baik dengan risiko mortalitas populasi pasien yang dirawat di ICU, tetapi tidak mempunyai keakuratan dalam memprediksikan mortalitas pasien secara individu.16 Pada penelitian di ICU RSHS pada tahun 2004, diperoleh diskriminasi dari APACHE II score sebesar 0,76 yang dilakukan perbandingan terhadap LODS dengan nilai diskriminasi sebesar 0,79.17 Penilaian ini digunakan untuk menggambarkan kesakitan dari pasien yang dibandingkan dengan pasien lain dan memperkirakan mortalitas pasien dari kelompok pasien lain.13 Validasi pada 5.815 pasien ICU yang dirawat di 13 rumah sakit berbeda tidak ada pasien yang mempunyai nilai lebih dari 55.1,13 Semakin besar nilai APACHE II seseorang, semakin berat penyakit yang diderita pasien tersebut dan semakin besar risiko mortalitasnya. 1,13 Akan tetapi, perhitungan nilai APACHE II memiliki keterbatasan dalam menentukan prognosis mortalitas pasien dari ICU. Hal ini disebabkan oleh nilai APACHE II berdasarkan data tahun 1979-1982. Pasien dengan kasus trauma dan operasi masih sedikit saat itu dan indikasi rawat ICU berbeda antara masa tersebut dan saat ini.18 APACHE II dan III menggunakan nilai yang salah atau kurang tepat untuk penilaian perubahan pada variabel fisiologisnya (seperti tekanan darah dan laju denyut jantung) pada 24 jam pertama setelah pasien tersebut masuk ICU. Banyak nilai yang menggunakan data yang dikumpulkan atau diambil setelah lebih dari 24 jam, bergantung pada kualitas pelayanan dari ICU.19,20 Penggunaan nilai yang kurang tepat tadi akan memberikan nilai APACHE yang tidak akurat.20 Pengumpulan data dari 12 variabel pada lebih dari 24 jam pertama adalah sulit, atau kadang-kadang terjadi data dikumpulkan secara tidak akurat atau semua data tidak dikumpulkan.19,21 Nilai APACHE II dapat digunakan untuk populasi, tetapi tidak dapat memprediksikan pada individu. Pasien yang menerima obat sedasi atau pelumpuh otot akan sulit untuk dinilai variabel GCS. 16 Salah satu sistem nilai yang lebih sederhana yang dikembangkan oleh kelompok kerja dari European Society of Intensive Care Medicine yaitu Sequential Organ Failure Assessment score (SOFA score) yang menilai enam sistem organ dari 0-4 derajat kegagalan organ.22 Selain itu, keakuratan dan ketepatan dari penilaian SOFA score sudah diakui baik oleh sejumlah klinisi.22 Parameter yang dihitung dalam Majalah Kedokteran Terapi Intensif Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri SOFA score meliputi organ respirasi, renal, hepatik, kardiovaskular, hematologi, dan GCS. SOFA score dapat membantu untuk melihat disfungsi organ atau gagal organ selama perawatan dan dapat digunakan untuk memprediksikan tingkat mortalitas dari pasien yang dirawat di ICU.23 Walaupun sistem nilai ini hanya dapat memberikan gambaran dan kualitas dari fungsi organ dan bukan untuk memberikan gambaran mortalitas pasien di ICU, ada hubungan yang nyata antara disfungi organ dan angka mortalitas. Hal ini telah diperlihatkan oleh beberapa penelitian.6 Tujuan penelitian ini adalah membandingkan validasi sistem penilaian APACHE II dan SOFA dalam memperkirakan mortalitas pasien-pasien yang dirawat di ICU RS Hasan Sadikin. METODE Tipe penelitian ini adalah penelitian observasional longitudinal prospektif. Penelitian ini dilakukan selama kurun waktu 7 Juli sampai dengan 20 Oktober 2008 sejumlah 132 pasien yang masuk ke ICU Rumah Sakit Hasan Sadikin (RSHS). Uji validasi yang dilakukan adalah diskriminasi dan kalibrasi. Diskriminasi adalah kemampuan suatu sistem penilaian dalam menentukan pasien antara yang hidup dan yang mati. Untuk menilai diskriminasi sistem nilai, pasien dikelompokkan berdasarkan Probability Of Death (POD), kemudian dianalisis dengan menggunakan tabel 2 x 2, untuk menghitung sensitivitas dan spesifisitas. Selanjutnya, dibuat kurva Receiver Operating Characteristic Curve (ROC Curve) dengan sumbu x adalah nilai dari spesifisitas (false positive rate) dan sumbu y adalah nilai dari sensitivitas (true positive rate). Area di bawah ROC disebut Area Under the ROC Curve (AuROC). Nilai AuROC ini adalah nilai diskriminasi sistem penilaian. Jika nilai AuROC >0,7, sistem penilaian tersebut mempunyai nilai diskriminasi yang baik. Semakin besar nilai AuROC suatu sistem penilaian maka semakin besar kemampuan diskriminasi sistem penilaian tersebut. Nilai AuROC = 1 menunjukkan bahwa sistem penilaian mempunyai mampuan prediksi yang sempurna.24,26 Sensitivitas adalah kemampuan suatu uji untuk menemukan suatu keadaan bila keadaan tersebut benar-benar ada. Spesifisitas adalah kemampuan suatu uji untuk menemukan tidak adanya suatu keadaan bila keadaan tersebut benar-benar tidak ada. Akurasi adalah seberapa besar ketepatan dari alat ukur yang digunakan. Dengan menggunakan tabel 2x2, sensitivitas, spesifisitas, dan akurasi dari POD Volume 2 Nomor 1 Januari 2012 suatu sistem penilaian dapat diperoleh. Kurva ROC diperoleh dengan menggunakan hubungan antara 1– spesifisitas (sumbu x) dengan sensitivitas (sumbu y). Kalibrasi adalah perbandingan antara prediksi mortalitas dan keluaran pada semua tingkatan dari penilaian. Semua sampel validasi dikelompokkan menjadi subgrup berdasarkan nilai prediksi mortalitas. Pada umumnya, sampel dikelompokkan menjadi 10 tingkatan yang disebut deciles of risk. Sampel diuji dengan menggunakan uji statistik Hosmer Lameshow goodnees of fit. Nilai goodnees of fit yang rendah memperlihatkan ketepatan antara prediksi dan outcome pasien. Jika nilai p (p value) kalibrasi sistem nilai lebih tinggi, dapat dikatakan bahwa kalibrasi mempunyai ketepatan yang lebih baik untuk sistem nilai tersebut. Semakin besar perbedaan antara prediksi mortalitas dan yang sebenarnya berarti semakin tinggi nilai chi-kuadrat, dan ini semakin tidak baik kalibrasinya.12,15,24-16 Untuk membandingkan sistem penilaian APACHE II dan SOFA dalam memprediksi mortalitas digunakan uji Mann-Whitney. Analisis regresi digunakan untuk mengetahui hubungan antara APACHE II score atau SOFA score dan keluaran, serta menentukan cut off point APACHE II score dan SOFA score berdasarkan ROC curve, kemudian dilihat besarnya sensitivitas, spesifisitas, dan akurasi serta besarnya AuROC. Untuk membandingkan peluang mortalitas antara SOFA score dan peluang mortalitas berdasarkan APACHE II score digunakan tabel 2 X 2, dengan menggunakan uji dua proporsi. Nilai p < 0,05 dianggap perbedaan secara statistis bermakna. HASIL Penelitian dilakukan pada 132 pasien yang dirawat di ICU RSHS. (Tabel 1 dan 2) APACHE II score nilai uji Mann-Whitney 7,558 dengan p < 0,001 dan SOFA score nilai uji MannWhitney 6,957 dengan p < 0,001. POD APACHE II score mempunyai nilai uji Mann-Whitney 7,686 dengan p < 0,001 dan POD SOFA score mempunyai nilai uji Mann-Whitney 8,166 dengan p < 0,001.(Tabel 3) APACHE II score dan SOFA score mempunyai hubungan, baik menurut POD maupun nilai. Koefisien korelasi rank spearman untuk POD antara APACHE II score dan SOFA score adalah 0,712 dengan p < 0,001 dan koefisien korelasi rank spearman untuk nilai adalah 0,693 dengan p < 0,001. Hal ini menunjukkan bahwa pada kedua kelompok 13 Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif Tabel 1: Karakteristik pada kedua kelompok Karakteristik Outcome Hidup (n=96) % Umur (tahun) < 30 37 38,5 30 – 39 15 15,6 40 – 49 12 12,5 50 – 59 13 13,5 60 – 69 12 12,5 70 + 7 7,3 rerata (SD) 40,5(18,4) Median 37,5 Rentang 18 – 85 Jenis Kelamin Laki-laki 46 47,9 Perempuan 50 52,1 LOS x(SD) 4,3(4,6) Median 3 Rentang 1 – 26 Kasus Bedah Saraf 11 11,5 Pembedahan Elektif 29 30,2 Pembedahan Emergensi 43 44,8 Non-Pembedahan 1 3 13,5 Mati (n=36) % Kemaknaan 4 11,1 6 16,7 4 11,1 9 25,0 8 22,2 5 13,9 51,4(18,5) 53,5 18 – 92 20 16 Zmw= 2,924 p = 0,004 55,6 44,4 x2 = 0,612 p = 0,434 8,4(11,0) 4 1 – 57 0 4 20 12 Zmw=2,894 p = 0,004 0 11,1 55,6 33,3 x2 = 16,956 p = < 0,001 Keterangan: Zmw = Uji Mann-Whitney, LOS = Length of Stay, x2 = Uji chi-kuadrat Tabel 2: Karakteristik berdasarkan bagian Bagian Bedah Umum Penyakit Dalam Bedah Saraf Kebidanan Ortopedi dan Traumatologi Penyakit Saraf Jumlah Hidup 4 7 16 17 8 3 96 % 68,2 50,0 84,2 89,5 88,9 60,0 72,7 Mati 21 7 3 2 1 2 36 Jumlah % 31,8 50,0 15,8 10,5 11,1 40,0 27,3 66 14 19 19 9 5 132 % 50,0 10,6 14,4 14,4 6,8 3,8 100,0 Keterangan: x2 = 10,348, p = 0,066 Tabel 3: Berdasarkan POD dan nilai pada kedua kelompok Keluaran Hidup (n=96) Nilai APACHE II x(SD) 11,9(3,7) Median 12 Rentang 5 – 21 Nilai SOFA x(SD) 2,8(1,9) Median 2 Rentang 0–9 POD APACHE II x(SD) 15,3(6,7) Median 15 Rentang 8 – 40 POD SOFA x(SD) 3,9(5,3) Median 2 Rentang 0 – 26 Keterangan: 14 Zmw Nilai p 20,2(4,4) 20,5 12 – 29 7,558 <0,001 8,3(3,1) 7,5 4 – 15 6,957 <0,001 35,0(12,7) 40 15 – 55 7,686 <0,001 33,5(27,9) 22 7 – 86 8,166 <0,001 Mati (n=36) Zmw = Uji Mann-Whitney. Majalah Kedokteran Terapi Intensif Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri Tabel 4: Korelasi antara SOFA dan APACHE 2 Nilai APACHE 2 – SOFA POD APACHE 2 – SOFA תs Nilai p 0,693 0,712 <0,001 <0,001 Keterangan: תs= koefisien korelasi Rank Spearman Tabel 5: Klasifikasi APACHE II score No POD (%) 1 2 3 4 5 > 8 ≤ 8 > 15 ≤ 15 > 25 ≤ 25 > 40 ≤ 40 > 55 ≤ 55 Keluaran Hidup Mati (n=96) (n=36) 69 27 19 77 2 94 0 96 0 96 Sens. (%) NP (+) (%) 36 100 28,1 34,3 0 33 91,7 80,2 63,5 3 19 52,8 97,9 90,5 17 7 19,4 100 100 29 0 0 100 - 36 Keterangan: AuROC (95% ) = 0,912 (0,864 – 0,968) POD = Probabilithy of death NP (+) = Nilai Prediksi Positif NP(-) (%) Akurasi (%) 100 47,7 96,2 83,3 83,2 85,6 76,8 78,0 72,7 72,7 Sens = Sensitivitas Spes = Spesifisitas NP (-) = Nilai Prediksi Negatif Gambar 1: Grafik AuROC curve dari APACHE II score Keterangan: AuROC = Area under Receiver Operating Characteristic dapat dilakukan uji perbandingan karena mempunyai nilai p < 0,05 yang bermakna.(Tabel 4) Hasil diskriminasi APACHE II score yang dilakukan pada pasien yang dirawat di RSHS menunjukkan bahwa akurasi dari APACHE II score sangat baik pada periode penelitian diperoleh dengan menghitung sensitivitas, spesifisitas, dan Volume 2 Nomor 1 Januari 2012 Spes (%) akurasi. (Tabel 5) AuROC curve adalah 0,912. Hal ini menunjukkan bahwa akurasi dari APACHE II score sangat baik. (Gambar 1) Sedangkan hasil diskriminasi dari SOFA score yang dilakukan pada pasien yang dirawat di ICU RSHS dengan AuROC curve adalah 0,951. (Gambar 2 dan Tabel 6) Hasil kalibrasi APACHE II score yang dilakukan pada pasien yang dirawat di ICU RSHS pada periode penelitian dengan menggunakan uji Lameshow Hosmer goodness of fit adalah p = 0,239 dengan uji chi-kuadratnya = 5,506. ( Table 7) Hasil kalibrasi dari SOFA score yang dilakukan pada pasien yang dirawat di ICU RSHS pada periode penelitian dengan menggunakan uji Lameshow–Hosmer goodness of fit dan didapatkan hasil kalibrasinya adalah p = 0,450 dengan uji chikuadratnya = 2,641. (Tabel 8) Hubungan subvariabel SOFA score terhadap mortalitas pasien yang dirawat di ICU berdasarkan analisis regresi logistik ganda. Dari keenam organ yang menjadi standar penilaian dalam SOFA score, hanya subvariabel koagulasi yang mempunyai nilai p=0,227 yang menunjukkan bahwa subvariabel ini kurang bermakna terhadap mortalitas pasien. Dari subvariabel SOFA score ini diketahui bahwa yang sangat berpengaruh adalah subvariabel 15 Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif Tabel 6: Klasifikasi SOFA score No POD (%) 1 2 3 4 5 6 > 2 ≤ 2 > 7 ≤ 7 > 18 ≤ 18 > 26 ≤ 26 > 46 ≤ 46 > 86 ≤ 86 Keluaran Hidup Mati (n=96) (n=36) 29 67 8 88 1 95 0 96 0 96 0 96 Sens (%) Spes. (%) 36 100 68,8 0 30 83,3 91,7 6 18 50 98,9 8 10 27,8 100 26 7 19,4 100 29 0 0 100 36 NP (+) (%) NP(-) (%) Akurasi (%) 55,4 100 78,0 78,9 93,6 89,4 94,7 92,2 85,6 100 78,7 80,3 87,5 76,6 78,0 0 72,7 72,7 Keterangan: AuROC (95% ) = 0,951 (0,918 – 0,984) Sens = Sensitivitas NP (+) = Nilai Prediksi Positif Spes = Spesifisitas NP (-) = Nilai Prediksi Negatif Gambar 2: Grafik AuROC dari SOFA score kardiovaskular (p=0,001), respirasi (p=0,002), neurologi (p=0,005), hepar (p=0,03), dan ginjal (p=0,04). Artinya, kenaikan dari subvariabel kardiovaskular sebesar 1 unit akan meningkatkan mortalitas pasien sebesar 3,956%, dengan nilai keakuratannya sebesar 90,15%. (Tabel 9) PEMBAHASAN Sistem penilaian untuk kegagalan fungsi organ dirancang terutama sebagai perangkat deskriptif yang ditujukan dalam menetapkan suatu standardisasi definisi untuk stratifikasi dan perbandingan status pasien di ICU, juga dapat dipergunakan secara statistis untuk menyesuaikan analisis untuk karakteristik dasar pada penelitian-penelitian kohort, untuk menentukan definisi dalam subkelompok, dan 16 perbandingan langsung disfungsi organ di antara kelompok-kelompok sebagai hasil sekunder pada penelitian-penelitian acak.7 Karakterisitik pasien pada penelitian ini menunjukan bahwa tidak ada perbedaan yang bermakna antara pasien laki-laki dan perempuan dengan nilai p=0,434. Artinya, bahwa subjek penelitian tidak membedakan jenis kelamin. Hal ini menunjukkan bahwa apabila dilakukan penilaian sistem skoring, jenis kelamin tidak akan mempengaruhi hasil akhir penelitian secara bermakna. Faktor usia pada subjek penelitian menunjukkan perbedaan yang bermakna (p=0,004). Semakin tua seseorang maka semakin besar pula mortalitasnya, dengan usia ratarata yang meninggal adalah 51,4 (18,5) tahun dan usia rata-rata yang hidup adalah 40,5 (18,4) tahun. Lama perawatan juga menunjukkan perbedaan yang bermakna (p=0,004). Pasien yang meninggal ratarata dirawat selama 8,4 (11,0) hari dan pasien yang hidup rata-rata dirawat selama 4,3 (4,6) hari. (Tabel 1) Dari jenis tindakan (pembedahan elektif, emergensi, atau non-bedah) terdapat pula perbedaan yang bermakna (p<0,001). Pasien non-bedah mempunyai nilai persentase mortalitas yang tinggi sebesar 48%, sedangkan pasien yang menjalani pembedahan emergensi memiliki nilai persentase mortalitas sebesar 31,8%, dan yang menjalani pembedahan elektif hanya 12,1%, sedangkan pada pasien-pasien pasca bedah saraf tidak ada yang meninggal dunia. Pasien bedah yang dirawat di ICU pada periode penelitian paling banyak, yakni sebanyak 50%, pasien Majalah Kedokteran Terapi Intensif Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri Tabel 7: Lameshow – Hosmer Goodnees of fit APACHE II score Hidup POD (%) Jumlah 8 15 25 40 55 27 53 31 14 7 Keterangan: x2 = 5,506 Keluaran Prediksi 27 50 17 2 0 df = 4 26,533 49,264 19,246 0,936 0,022 Mati Outcome Prediksi 0 3 14 12 7 0,467 3,736 11,754 13,064 6,978 p = 0,239 Tabel 8: Lameshow – Hosmer Goodnees of fit SOFA score POD (%) 0 7 18 26 46 86 Jumlah 27 40 27 19 12 7 Keterangan: x2 = 2,641 Hidup Mati Keluaran Prediksi Outcome 27 40 21 7 1 0 26,379 38,523 23,900 6,567 0,631 0 0 0 6 12 11 7 df = 3 Prediksi 0,621 1,477 3,100 12,433 11,369 7,000 p = 0,450 Tabel 9: Hubungan antara sub-variabel SOFA score terhadap mortalitas berdasarkan analisis regresi logistik ganda Sub-variabel SOFA Neurologi Kardiovaskular Respirasi Koagulasi Hepar Ginjal Koef β SE(β) Nilai p OR 1,312 1,375 1,182 0,476 0,695 0,665 0,470 0,323 0,375 0,393 0,312 0,320 0,005 0,001 0,002 0,227 0,026 0,037 3,715 3,956 3,262 1,609 2,005 1,945 Keterangan: Akurasi model= 90,15% Keof β = Koefisien regresi SE(β) = Standar Error OR = Odds Ratio bedah saraf dan kebidanan masing-masing 14,4%, pasien dari bagian penyakit dalam 10,6%, pasien bagian ortopedi dan traumatologi 6,8%, dan pasien dari bagian saraf 3,8%. Akan tetapi, karakteristik subjek penelitian berdasarkan asal pasien dirawat bagian ini tidak bermakna, hal ini membuktikan bahwa pasien-pasien yang dirawat di ICU RSHS sangat bervariasi. Perbedaan APACHE II score dan SOFA score sangat bermakna (p < 0,05) (Tabel 3). Nilai untuk APACHE II score dengan hasil akhir perawatan Volume 2 Nomor 1 Januari 2012 pasiennya meninggal adalah 20,2 (4,4) dan hasil akhir perawatan pasiennya hidup adalah 11,9 (3,7), sedangkan nilai untuk SOFA score pada pasien yang meninggal adalah 8,3 (3,1) dan pasien yang hidup 2,8 (1,9). Nilai rata-rata POD APACHE II score dengan akhir perawatan pasiennya meninggal adalah 35,0 (12,7), sedangkan nilai rata-rata SOFA score adalah 33,5 (27,9), yang secara statistik perbedaan keduanya sangat bermakna (p < 0,05). Pada pasien yang masuk ke ICU dengan jumlah nilai APACHE II score lebih dari 21 (dengan POD 17 Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif 40%) atau nilai SOFA score lebih dari 9 (dengan POD 26%), kemungkinan meninggal lebih besar. Begitu juga sebaliknya, jika pasien yang masuk ke ICU dengan jumlah nilai APACHE II score kurang dari 12 (dengan POD 15%) atau nilai SOFA score kurang dari 3 (POD 2%), kemungkinan hidup pada pasien ini lebih besar. Berdasarkan bukti adanya hubungan korelasi antara sistem APACHE II score dan sistem SOFA score, baik hubungan antara nilai APACHE II– SOFA score maupun POD APACHE II – SOFA score, (Tabel 4) maka kedua sistem penilaian ini dapat dilakukan perbandingan. Sejumlah parameter fisiologi digunakan untuk mendefinisikan disfungsi organ, yaitu paru-paru, kardiovaskular, ginjal, hati, hematologi, dan sistem saraf pusat adalah organ yang umumnya digunakan untuk penilaian dari disfungsi atau gagal organ pada pasien yang dirawat di ICU.6,9 Disfungsi organ ini diduga disebabkan karena tidak adekuatnya pasokan oksigen untuk memenuhi kebutuhan metabolisme, jika keadaan ini berlangsung lama maka akan berakibat pada kegagalan beberapa organ.27 Deskripsi pada disfungsi sistem kardiovaskular dinilai dengan tekanan arteri merata, rasio tekanan parsial oksigen arteri dan fraksi inspirasi oksigen (PaO2/FiO2) untuk sistem pernapasan, konsentrasi serum kreatinin untuk sistem ginjal, konsentrasi serum bilirubin untuk hepar, hitung trombosit untuk sistem hematologi, dan GCS untuk sistem saraf pusat.22 Disfungsi organ rata-rata terjadi pada hari ke-2 yaitu diawali dengan disfungsi neurologis, respirasi, kardiovaskuler, ginjal, koagulasi dan terakhir hepar.28 Pada penelitian ini dapat diketahui bahwa yang sangat berpengaruh adalah kardiovaskular, respirasi, neurologi, hepar, ginjal dan koagulasi. Setiap kenaikan sebesar 1 unit variabel kardiovaskuler akan meningkatkan mortalitas pasien sebesar 3,956%, dengan nilai keakuratannya sebesar 90,15%. Disfungsi organ adalah proses yang berjalan dinamis. Karenanya, evaluasi terhadap disfungsi organ setiap waktu selama perawatan di ICU sangat membantu dalam mengikuti perkembangan penyakit dan dapat memberikan gambaran korelasi yang kuat dengan hasil akhir dari perawatan di ICU. Penilaian disfungsi sistem organ juga bermanfaat dalam mengidentifikasi pasien-pasien yang tidak memberikan respons dalam pengobatan yang telah diberikan selama beberapa hari sehingga terapi intensif dapat dipertimbangkan tidak memberikan manfaat.7,18 Derajat gangguan fisiologis yang muncul saat pasien masuk ICU merupakan faktor yang potensial 18 untuk melihat angka survival di ICU dan kelainan fungsi organ yang ireversibel adalah skala mortalitas yang paling menonjol. Pengukuran formal untuk derajat keparahan gangguan fisiologis atau evolusi dari disfungsi organ dari waktu ke waktu tidak selalu dapat diterapkan secara individual pada pasien-pasien di ICU. Bagaimanapun, validasi dari sistem penilaian telah memberikan nilai yang tidak terhingga yang dibuktikan dalam menggambarkan populasi pasien dan menaksir angka morbiditas di ICU pada kelompok-kelompok pasien tertentu.7 Kurva ROC untuk APACHE II score, dengan AuROC adalah 0,912, sedangkan kurva ROC untuk SOFA score, dengan AuROC adalah 0,951(Gambar 2 dan 3). Nilai AuROC adalah nilai diskriminasi sistem penilaian. Hal ini berarti bahwa APACHE II dan SOFA score mempunyai nilai diskriminasi yang sangat baik karena suatu sistem penilaian dikatakan cukup baik jika mempunyai nilai AuROC > 0,7. Semakin besar nilai AuROC suatu sistem penilaian, semakin besar pula kemampuan diskriminasi sistem penilaian tersebut. Nilai AuROC=1 menunjukan bahwa sistem penilaian mempunyai kemampuan prediksi yang sempurna dan AuROC = 0,5 menunjukkan bahwa persentase kebenaran dan persentase kesalahan dalam memprediksi adalah sama.12,15,24,25,26 Pada penelitian di ICU RSHS pada tahun 2004, diperoleh diskriminasi dari APACHE II score sebesar 0,76 yang dibandingkan dengan LODS yang nilai diskriminasinya sebesar 0,79.17 Masalah pada penelitian tersebut adalah pengambilan sampel yang bersifat retrospektif, sehingga jumlah sampel yang dikeluarkan sangat besar karena data pasien yang tidak lengkap (sebanyak 194 pasien dikeluarkan dari 573 pasien) dan pada lembar observasi sering tidak tergambar data tentang alasan seorang pasien harus mendapat obat-obat inotropik, vasokonstriktor atau antiaritmia. Kesulitan lain yang dilaporkan adalah perhitungan PaO2 dan FiO2. Nilai PaO2 saat itu belum tentu merupakan nilai yang sesuai dengan pemberian FiO2 sehingga mempengaruhi ketepatan nilai. Penilaian GCS pasien juga sulit ditentukan, karena GCS pasien hanya berdasarkan data dari lembar observasi, sehingga pengaruh obat-obatan sedasi tidak tercatat sehingga hal ini mempengaruhi nilai GCS yang sebenarnya. Untuk penilaian penyakit kronis diragukan karena dari lembar observasi tidak ditemukan data tentang penyakit kronis pasien, demikian pula data tentang pasien benar-benar menjalani operasi emergensi tidak ada. Data yang ada hanya menyebutkan bahwa pasien datang dari ruang operasi 24 jam, ruang operasi elektif, ruang resusitasi atau dari ruang perawatan.17 Majalah Kedokteran Terapi Intensif Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri Masalah tersebut berusaha dihilangkan pada penelitian ini dengan pengambilan sampel (n=132) yang bersifat prospektif. Jumlah subyek yang dikeluarkan sebanyak 2 pasien karena pulang paksa, 6 pasien berusia < 18 tahun dan 20 pasien dirawat kurang dari 24 jam pertama di ICU. Pasien-pasien yang dirawat < 24 jam pertama di ICU tidak dapat dimasukkan dalam penelitian ini karena persyaratan penilaian untuk APACHE II score adalah setelah pasien dirawat > 24 jam di ICU. Penelitian ini adalah penelitian observasional longitudinal, yaitu peneliti mengikuti perkembangan pasien hingga keluar dari ICU. Sehingga alasan pemberian obat-obat inotropik, vasokonstrtriktor dan antiaritmia dapat diketahui oleh peneliti. Perhitungan PaO2 dan FiO2 dapat dilakukan karena nilai FiO2 yang diberikan saat pengambilan AGD dapat diketahui. Penilaian GCS pada penelitian ini dilakukan dengan menghentikan pemberian obatobatan sedasi beberapa jam sebelum penilaian, sehingga pengaruh dari obat sedasi terhadap GCS dapat dikurangi. Data tentang penyakit kronis pasien, didapatkan dari anamnesis keluarga pasien, sedangkan untuk mengetahui pasien telah menjalani operasi emergensi atau elektif peneliti mencatat saat pasien tersebut masuk ke ICU. Hasil kalibrasi APACHE II score pada periode penelitian dengan uji Lameshow – Hosmer goodness of fit menunjukkan hasilnya adalah p = 0,239 dengan uji chi-kuadratnya = 5,506 (Tabel 7), sedangkan hasil kalibrasi dari SOFA score pada periode penelitian dengan uji Lameshow – Hosmer goodness of fit dan didapatkan hasil kalibrasinya adalah p = 0,450 dengan uji chi-kuadratnya = 2,641(Tabel 8). Pada penelitian di RSHS pada tahun 2004, diperoleh kalibrasi dari APACHE II score dengan uji chi-kuadrat sebesar 7, 40,08. Kesimpulan SOFA Score lebih akurat dalam memperkirakan mortalitas pasien-pasien di ICU RSUP Hasan Sadikin Bandung, karena mempunyai nilai diskriminasi dan kalibrasi yang lebih baik dibandingkan APACHE II Score. DAFTAR PUSTAKA 1. Shortell SM, Zimmerman JE, Rouseau DM. The performance of intensive care unit : does good management make difference. Med Care. 1994; 32: 508-25. 2. Cullen DJ, Chernow B. Predicting outcome in critically ill patients. Crit Care Med. 1994; 22: 1345-8. Volume 2 Nomor 1 Januari 2012 3. Knaus WA, Draper EA, Wagner DP, Zimmerman JE. APACHE II: a severityof disease classification system. Crit Care Med. 1985; 13: 818-29. 4. Le Gall JR, Lemeshow S, Saulnier F. A new simplified acute physiology score (SAPS II) based on a European/North American multicenter study. JAMA. 1993; 270: 2957-63. 5. Lemeshow S, Teres D, Avrunin JS, Gage RW. Refining intensive care unit outcome prediction by using changing probabilities of mortality. Crit Care Med. 1988; 16: 470-7. 6. Ferreire FL, Bota DP, Bross A, Mélot C, Vincent JL. Serial evaluation of the SOFA score to predict outcome in critically ill patients. JAMA. 2001; 286: 1754-8. 7. Marshall JC. Multiple organ dysfunction syndrome. Crit Care Med. 2003; 8: 1-20. 8. Le Gall JR, Klar J, Lameshow S, Saulnier F, Albert C. The logistic organ dysfungtion system: A new way to assess organ dysfunction in the ICU. JAMA. 1996; 802-10. 9. Tran DD, Groeneveld ABJ, Vander Muelen J, Nauta JJP, Strack VS, Thijs LG. Age, chronic disease, sepsis, organ system failure, and mortality in a medical intensive care unit. Crit Care Med. 1990; 18:474-9. 10. Deitch EA. Multiple organ failure: pathophysiology and potential future therapy. Ann Surg. 1992; 216: 117-34. 11. Sakr C, Sphonholz, Reinhart K. Organ dysfunction in the ICU: a clinical perspective. In: Vincent JL, ed. 2007 Yearbook of intensive care and emergency medicine. New York: Springer; 2007. p. 238-43. 12. Gregoire G, Russell JA. Assessment of severity of illness. In: Principles of critical care. 2nd ed. USA: Mc Graw-Hill; 1998. p.57-67. 13. APACHE II accessed: 15 April 2008. Available from: http://en.wikipedia.org/wiki/APACHE _II 14. Gunning K, Rowan K. Outcome data and scoring system. BMJ. 1999; 319: 241-4. 15. Lemeshow S, Le Gall JR. Modeling the severity of illness of ICU patients. JAMA. 1994; 272: 1094-55. 16. Whitelly SM, Bodenham A, Bellany MC. Intensive care. Philadelphia: Elsevier; 2006. p. 7-11. 17. Nuraini, Redjeki IS, Bisri T. Perbandingan validasi logitic organ dysfunction system (LODS) score dan APACHE II ditinjau dari diskriminasi dan kalibrasi. FKUP, Bandung, 2004. 18. Johnson D, Mayers I. Multile organ dysfunction syndrome: a narrative review. Neuroanesthesia and Intensive Care. 2001; 5: 502-9. 19 Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif 19. Shann F. Mortality prediction model is preferable to APACHE as an intensive care scoring system. BMJ. 1999; 320: 714. 20. Shann F, Pearson G, Slater A, Wilkinson K. Paediatric index of mortality (PIM): a mortality prediction model for children in intensive care. Intensive Care Med. 1997; 23: 201-07. 21. Bosman RJ, Oudemans SHM, Zandstra DF. The use of intensive care information systems alters outcome prediction. Intensive Care Med. 1998; 24: 953-58. 22. Sakr C, Sphonholz, Reinhart K. Organ dysfunction in the ICU: a clinical perspective. In: Vincent JL, ed. 2007 Yearbook of intensive care and emergency medicine. New York: Springer; 2007. p. 238-43. 23. Vincent JL, Moreno R, Takala J. SOFA score to describe organ dysfunction/failure. Intensive Care Med. 1996; 22: 707-10. 24. Simon S. ROC. Children’s Mercy Hospital & Clinics. 18 Agustus 1999. Accessed: 23 April 20 2008. Available from: http://www.childrensmercy.org. 25. Liu H, Li G, Cumberland WG, Wu T. Testing statistical significance of the area under a receiving operating characteristics curve for repeated measures design with bootstrapping. J of data science. 2005;3: 257-8. 26. Mandrekar JN, Mandrekar SJ. Statistical methods in diagnostic medicine using SAS@sofware. SAS institute. Accessed 26 Apr 2008. Available from: http://ftp.sas.com/techsup/download/stat/ roc.html. 27. Bakker J, deLima AP. Increased blood lactate levels: An important warning signal in surgical practice. Crit Care Med. 2004; 8: 96-7. 28. Marshall JC, Cook DJ, Christou NV, Bernard GR, Sprung C, Sibbad WJ. Multiple organ dysfunction score: A reliable descriptor of a complex clincal outcome. Crit Care Med. 1995; 23: 1638-52. Majalah Kedokteran Terapi Intensif