Perbandingan Validasi APACHE II dan SOFA Score untuk

advertisement
ARTIKEL PENELITIAN
Perbandingan Validasi APACHE II dan SOFA Score
untuk Memperkirakan Mortalitas Pasien
yang Dirawat di Ruang Perawatan Intensif
Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri
ABSTRACT
Background: Outcome prediction is important
both in clinical and administrative Intensive Care
Unit (ICU) management. A good scoring system
will be able to predict an acurate prognosis for the
patients who admitted to ICU.
Objective: To estimate the accuracy of the
scoring system, a validation in the discrimination
and calibration of the scoring system is being done.
Methods: The research was enrolled in 132
patients who admitted to Intensive Care Unit Dr. Hasan Sadikin Hospital Bandung from 7th
of July until 20th October 2008. All patients were
scored using the APACHE II and SOFA score, and
probability of death (POD) of both score during
the first 24 hours, and outcome at the end of the
treatment period whether the patients live or die.
The data from this research were statistically tested
using Mann-Whitney, a regression analysis was to
consider the relationship between APACHE II score
and SOFA score with the outcome and to find out
the cut off point for the APACHE II and SOFA score
based on the ROC curve, than to see the sensitivity,
specificity, acuracy and the value of AuROC. The
p<0,05 is considered meaningful for the statistic
test. Calibration is done using Lameshow – Hosmer
Goodness of fit.
Result: The result showed that a Rank Spearman
coefisient correlation for scores and POD between
Departemen Anestesiologi dan Reanimasi
Fakultas Kedokteran Universitas Padjadjaran Bandung
Jl. Pasteur No. 38, Bandung 40161
Korespondensi : [email protected]
Volume 2 Nomor 1 Januari 2012
APACHE II and SOFA with p<0,001, which is
significantly meaningful. Area under receiver
operating characteristic (AuROC) APACHE II score
is 0,912 and AuROC for SOFA is 0,951. A calibration
for APACHE II score is p=0,239, with the chiquadrat=5,506, whereas for SOFA score p=0,450
with the chi-quadrat = 2,641.
Conclusion: SOFA score is more accurate in
predicting outcome of the patients in the ICU Dr.
Hasan Sadikin Hospital, Bandung. it’s had a better
validation (discrimination and calibration) in
comparisson the APACHE II score. (Maj Ked Ter
Intensif. 2012; 2(1): 11 - 20)
Key words: APACHE II score with, SOFA score,
validation, discrimination, calibration, AuROC.
PENDAHULUAN
Memperkirakan
mortalitas
pasien
dari
ruang perawatan intensif atau Intensive Care
Unit (ICU) sangat penting, baik secara klinik
maupun administrasi. Prediksi mortalitas pasien
bukanlah merupakan penilaian kinerja ICU, tetapi
memperkirakan pasien saat keluar dari ICU dapat
membantu memantau keadaan pasien dan membantu
memberikan informasi mengenai kelanjutan dari
pasien yang berhubungan dengan keadaan penyakit
pasien dan dapat dijadikan panduan untuk keputusan
terapi selanjutnya pada pasien.
Pada saat ini tersedia beberapa model berupa
sistem penilaian yang dapat digunakan untuk
memperkirakan mortalitas pasien, seperti Acute
Physiology and Chronic Health Evaluation
(APACHE), Simplified Acute Physiology Score
(SAPS), Mortality Probability Models (MPM),
11
Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif
Sequential Organ Failure Assessment (SOFA), Multi
Organ Dysfunction Score (MODS), dan Logistic
Organ Dysfungtion Score (LODS), yang dinilai
dan dihitung pada 24 jam pertama pasien dirawat
di ICU. Banyak faktor yang dapat mempengaruhi
pasien selama dirawat di ICU. Oleh karenanya,
diperlukan penilaian lain yang dapat mengevaluasi
perubahan pada pasien selama dirawat dan tetap
berdasarkan model-model penilaian yang telah ada.6
Kegagalan organ berhubungan dengan tingginya
angka mortalitas dan morbiditas pasien di ICU dan
tingginya biaya yang harus dikeluarkan.
Disfungsi organ adalah proses yang dinamis
oleh karena itu, evaluasi disfungsi organ setiap
waktu selama perawatan di ICU sangat membantu
dalam mengikuti perkembangan penyakit dan dapat
memberikan gambaran korelasi yang kuat dengan
hasil akhir dari perawatan di ICU. Disfungsi organ
sangat berhubungan dengan tingginya angka kesakitan
dan mortalitas pada pasien ICU dan juga berkaitan
dengan tingginya biaya di ICU.6,9 Sejumlah parameter
fisiologi digunakan untuk mendefinisikan disfungsi
organ, yaitu paru-paru, kardiovaskular, ginjal, hati,
hematologi, dan sistem saraf pusat adalah organ yang
umumnya digunakan untuk penilaian dari disfungsi
atau gagal organ pada pasien yang dirawat di ICU.
Pada tahun 1980 diajukan definisi empat gagal organ
sistem (system of four organ failures) untuk pasienpasien bedah yaitu paru-paru, hati, gastrointestinal,
dan ginjal. Peneliti lain mendefinisikan gagal sistem
organ (organ system failure) untuk lima sistem
organ, yaitu kardiovaskular, paru-paru, ginjal,
hematologi, dan gagal sistem neurologi. Ada juga
yang mendasarkan penilaian pada tujuh sistem organ
yang dinilai dalam tiga kategori, yakni 0 = fungsi
organ normal, 1= disfungsi organ, dan 2 = gagal
organ. Pada tahun 1993 dimasukkan infeksi dalam
definisi disfungsi organ.4
Sistem penilaian untuk disfungsi organ atau
kegagalan fungsi organ dirancang terutama
sebagai perangkat deskriptif yang ditujukan dalam
menetapkan suatu standardisasi definisi. 7,11
Manfaat sistem penilaian adalah untuk menilai
prognosis pasien, menilai kualitas pelayanan ICU,
dan dapat membuat homogenitas sampel pada suatu
penelitian di ICU.12 Suatu sistem penilaian yang baik
dapat memperkirakan prognosis pasien yang akurat,
dan akan membantu klinisi dalam melakukan triase
atau pemilahan pasien dan mengambil keputusan
kelanjutan terapi pasien, apakah akan dihentikan
terapinya (withdrawing) atau tidak akan ditingkatkan
terapinya (withholding) atau terapi akan tetap
diteruskan.13
12
Penggunaan sistem penilaian sebagai alat bantu
dalam mengambil keputusan merupakan hal yang
logis dan dianjurkan, tetapi sebaiknya memilih
sistem penilaian yang sudah tervalidasi baik.14,15
APACHE II score mempunyai korelasi yang
baik dengan risiko mortalitas populasi pasien yang
dirawat di ICU, tetapi tidak mempunyai keakuratan
dalam memprediksikan mortalitas pasien secara
individu.16 Pada penelitian di ICU RSHS pada tahun
2004, diperoleh diskriminasi dari APACHE II score
sebesar 0,76 yang dilakukan perbandingan terhadap
LODS dengan nilai diskriminasi sebesar 0,79.17
Penilaian ini digunakan untuk menggambarkan
kesakitan dari pasien yang dibandingkan dengan
pasien lain dan memperkirakan mortalitas pasien
dari kelompok pasien lain.13 Validasi pada 5.815
pasien ICU yang dirawat di 13 rumah sakit berbeda
tidak ada pasien yang mempunyai nilai lebih dari
55.1,13 Semakin besar nilai APACHE II seseorang,
semakin berat penyakit yang diderita pasien tersebut
dan semakin besar risiko mortalitasnya. 1,13
Akan tetapi, perhitungan nilai APACHE II
memiliki keterbatasan dalam menentukan prognosis
mortalitas pasien dari ICU. Hal ini disebabkan oleh
nilai APACHE II berdasarkan data tahun 1979-1982.
Pasien dengan kasus trauma dan operasi masih sedikit
saat itu dan indikasi rawat ICU berbeda antara masa
tersebut dan saat ini.18
APACHE II dan III menggunakan nilai yang
salah atau kurang tepat untuk penilaian perubahan
pada variabel fisiologisnya (seperti tekanan darah
dan laju denyut jantung) pada 24 jam pertama setelah
pasien tersebut masuk ICU. Banyak nilai yang
menggunakan data yang dikumpulkan atau diambil
setelah lebih dari 24 jam, bergantung pada kualitas
pelayanan dari ICU.19,20 Penggunaan nilai yang
kurang tepat tadi akan memberikan nilai APACHE
yang tidak akurat.20 Pengumpulan data dari 12
variabel pada lebih dari 24 jam pertama adalah sulit,
atau kadang-kadang terjadi data dikumpulkan secara
tidak akurat atau semua data tidak dikumpulkan.19,21
Nilai APACHE II dapat digunakan untuk populasi,
tetapi tidak dapat memprediksikan pada individu.
Pasien yang menerima obat sedasi atau pelumpuh
otot akan sulit untuk dinilai variabel GCS. 16
Salah satu sistem nilai yang lebih sederhana yang
dikembangkan oleh kelompok kerja dari European
Society of Intensive Care Medicine yaitu Sequential
Organ Failure Assessment score (SOFA score) yang
menilai enam sistem organ dari 0-4 derajat kegagalan
organ.22 Selain itu, keakuratan dan ketepatan dari
penilaian SOFA score sudah diakui baik oleh
sejumlah klinisi.22 Parameter yang dihitung dalam
Majalah Kedokteran Terapi Intensif
Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri
SOFA score meliputi organ respirasi, renal, hepatik,
kardiovaskular, hematologi, dan GCS.
SOFA score dapat membantu untuk melihat
disfungsi organ atau gagal organ selama perawatan
dan dapat digunakan untuk memprediksikan tingkat
mortalitas dari pasien yang dirawat di ICU.23
Walaupun sistem nilai ini hanya dapat memberikan
gambaran dan kualitas dari fungsi organ dan bukan
untuk memberikan gambaran mortalitas pasien di
ICU, ada hubungan yang nyata antara disfungi organ
dan angka mortalitas. Hal ini telah diperlihatkan oleh
beberapa penelitian.6
Tujuan penelitian ini adalah membandingkan
validasi sistem penilaian APACHE II dan SOFA
dalam memperkirakan mortalitas pasien-pasien yang
dirawat di ICU RS Hasan Sadikin.
METODE
Tipe penelitian ini adalah penelitian observasional
longitudinal prospektif. Penelitian ini dilakukan
selama kurun waktu 7 Juli sampai dengan 20
Oktober 2008 sejumlah 132 pasien yang masuk ke
ICU Rumah Sakit Hasan Sadikin (RSHS).
Uji validasi yang dilakukan adalah diskriminasi
dan kalibrasi. Diskriminasi adalah kemampuan
suatu sistem penilaian dalam menentukan pasien
antara yang hidup dan yang mati. Untuk menilai
diskriminasi sistem nilai, pasien dikelompokkan
berdasarkan Probability Of Death (POD), kemudian
dianalisis dengan menggunakan tabel 2 x 2, untuk
menghitung sensitivitas dan spesifisitas. Selanjutnya,
dibuat kurva Receiver Operating Characteristic
Curve (ROC Curve) dengan sumbu x adalah nilai
dari spesifisitas (false positive rate) dan sumbu y
adalah nilai dari sensitivitas (true positive rate). Area
di bawah ROC disebut Area Under the ROC Curve
(AuROC). Nilai AuROC ini adalah nilai diskriminasi
sistem penilaian. Jika nilai AuROC >0,7, sistem
penilaian tersebut mempunyai nilai diskriminasi
yang baik. Semakin besar nilai AuROC suatu
sistem penilaian maka semakin besar kemampuan
diskriminasi sistem penilaian tersebut. Nilai
AuROC = 1 menunjukkan bahwa sistem penilaian
mempunyai mampuan prediksi yang sempurna.24,26
Sensitivitas adalah kemampuan suatu uji untuk
menemukan suatu keadaan bila keadaan tersebut
benar-benar ada. Spesifisitas adalah kemampuan
suatu uji untuk menemukan tidak adanya suatu
keadaan bila keadaan tersebut benar-benar tidak ada.
Akurasi adalah seberapa besar ketepatan dari alat
ukur yang digunakan. Dengan menggunakan tabel
2x2, sensitivitas, spesifisitas, dan akurasi dari POD
Volume 2 Nomor 1 Januari 2012
suatu sistem penilaian dapat diperoleh. Kurva ROC
diperoleh dengan menggunakan hubungan antara
1– spesifisitas (sumbu x) dengan sensitivitas (sumbu
y).
Kalibrasi adalah perbandingan antara prediksi
mortalitas dan keluaran pada semua tingkatan dari
penilaian. Semua sampel validasi dikelompokkan
menjadi subgrup berdasarkan nilai prediksi
mortalitas. Pada umumnya, sampel dikelompokkan
menjadi 10 tingkatan yang disebut deciles of risk.
Sampel diuji dengan menggunakan uji statistik
Hosmer Lameshow goodnees of fit. Nilai goodnees
of fit yang rendah memperlihatkan ketepatan antara
prediksi dan outcome pasien. Jika nilai p (p value)
kalibrasi sistem nilai lebih tinggi, dapat dikatakan
bahwa kalibrasi mempunyai ketepatan yang lebih
baik untuk sistem nilai tersebut. Semakin besar
perbedaan antara prediksi mortalitas dan yang
sebenarnya berarti semakin tinggi nilai chi-kuadrat,
dan ini semakin tidak baik kalibrasinya.12,15,24-16
Untuk membandingkan sistem penilaian
APACHE II dan SOFA dalam memprediksi
mortalitas digunakan uji Mann-Whitney. Analisis
regresi digunakan untuk mengetahui hubungan antara
APACHE II score atau SOFA score dan keluaran,
serta menentukan cut off point APACHE II score
dan SOFA score berdasarkan ROC curve, kemudian
dilihat besarnya sensitivitas, spesifisitas, dan akurasi
serta besarnya AuROC. Untuk membandingkan
peluang mortalitas antara SOFA score dan peluang
mortalitas berdasarkan APACHE II score digunakan
tabel 2 X 2, dengan menggunakan uji dua proporsi.
Nilai p < 0,05 dianggap perbedaan secara statistis
bermakna.
HASIL
Penelitian dilakukan pada 132 pasien yang
dirawat di ICU RSHS. (Tabel 1 dan 2)
APACHE II score nilai uji Mann-Whitney 7,558
dengan p < 0,001 dan SOFA score nilai uji MannWhitney 6,957 dengan p < 0,001. POD APACHE
II score mempunyai nilai uji Mann-Whitney
7,686 dengan p < 0,001 dan POD SOFA score
mempunyai nilai uji Mann-Whitney 8,166 dengan p
< 0,001.(Tabel 3)
APACHE II score dan SOFA score mempunyai
hubungan, baik menurut POD maupun nilai.
Koefisien korelasi rank spearman untuk POD
antara APACHE II score dan SOFA score adalah
0,712 dengan p < 0,001 dan koefisien korelasi rank
spearman untuk nilai adalah 0,693 dengan p < 0,001.
Hal ini menunjukkan bahwa pada kedua kelompok
13
Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif
Tabel 1: Karakteristik pada kedua kelompok
Karakteristik
Outcome
Hidup (n=96)
%
Umur (tahun)
< 30
37
38,5
30 – 39 15
15,6
40 – 49
12
12,5
50 – 59 13
13,5
60 – 69 12
12,5
70 +
7
7,3
rerata (SD)
40,5(18,4)
Median
37,5
Rentang
18 – 85 Jenis Kelamin
Laki-laki
46
47,9
Perempuan
50
52,1
LOS
x(SD)
4,3(4,6)
Median
3
Rentang
1 – 26 Kasus
Bedah Saraf
11
11,5
Pembedahan Elektif
29
30,2
Pembedahan Emergensi
43
44,8
Non-Pembedahan 1
3
13,5
Mati (n=36)
%
Kemaknaan
4
11,1
6
16,7
4
11,1
9
25,0
8
22,2
5
13,9
51,4(18,5)
53,5
18 – 92 20
16
Zmw= 2,924
p = 0,004
55,6
44,4
x2 = 0,612
p = 0,434
8,4(11,0)
4
1 – 57
0
4
20
12
Zmw=2,894
p = 0,004
0
11,1
55,6
33,3
x2 = 16,956
p = < 0,001
Keterangan: Zmw = Uji Mann-Whitney, LOS = Length of Stay, x2 = Uji chi-kuadrat
Tabel 2: Karakteristik berdasarkan bagian
Bagian
Bedah Umum
Penyakit Dalam
Bedah Saraf
Kebidanan
Ortopedi dan Traumatologi
Penyakit Saraf
Jumlah
Hidup
4
7
16
17
8
3
96
%
68,2
50,0
84,2
89,5
88,9
60,0
72,7
Mati
21
7
3
2
1
2
36
Jumlah
%
31,8
50,0
15,8
10,5
11,1
40,0
27,3
66
14
19
19
9
5
132
%
50,0
10,6
14,4
14,4
6,8
3,8
100,0
Keterangan: x2 = 10,348, p = 0,066
Tabel 3: Berdasarkan POD dan nilai pada kedua kelompok
Keluaran
Hidup (n=96)
Nilai APACHE II
x(SD)
11,9(3,7)
Median
12
Rentang
5 – 21 Nilai SOFA
x(SD)
2,8(1,9)
Median
2
Rentang
0–9
POD APACHE II
x(SD)
15,3(6,7)
Median
15
Rentang
8 – 40 POD SOFA
x(SD)
3,9(5,3)
Median
2
Rentang
0 – 26 Keterangan:
14
Zmw
Nilai p
20,2(4,4)
20,5
12 – 29 7,558
<0,001
8,3(3,1)
7,5
4 – 15 6,957
<0,001
35,0(12,7)
40
15 – 55 7,686
<0,001
33,5(27,9)
22
7 – 86 8,166
<0,001
Mati (n=36)
Zmw = Uji Mann-Whitney.
Majalah Kedokteran Terapi Intensif
Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri
Tabel 4: Korelasi antara SOFA dan APACHE 2
Nilai APACHE 2 – SOFA
POD APACHE 2 – SOFA
‫ת‬s
Nilai p
0,693
0,712
<0,001
<0,001
Keterangan: ‫ת‬s= koefisien korelasi Rank Spearman
Tabel 5: Klasifikasi APACHE II score
No
POD
(%)
1
2
3
4
5
> 8
≤ 8
> 15
≤ 15
> 25
≤ 25
> 40
≤ 40
> 55
≤ 55
Keluaran
Hidup
Mati
(n=96)
(n=36)
69
27
19
77
2
94
0
96
0
96
Sens.
(%)
NP (+)
(%)
36
100
28,1
34,3
0
33
91,7
80,2
63,5
3
19
52,8
97,9
90,5
17
7
19,4
100
100
29
0
0
100
-
36
Keterangan:
AuROC (95% ) = 0,912 (0,864 – 0,968)
POD = Probabilithy of death
NP (+) = Nilai Prediksi Positif
NP(-)
(%)
Akurasi
(%)
100
47,7
96,2
83,3
83,2
85,6
76,8
78,0
72,7
72,7
Sens = Sensitivitas
Spes = Spesifisitas
NP (-) = Nilai Prediksi Negatif Gambar 1: Grafik AuROC curve dari APACHE II score
Keterangan: AuROC = Area under Receiver Operating Characteristic
dapat dilakukan uji perbandingan karena mempunyai
nilai p < 0,05 yang bermakna.(Tabel 4)
Hasil diskriminasi APACHE II score yang
dilakukan pada pasien yang dirawat di RSHS
menunjukkan bahwa akurasi dari APACHE II
score sangat baik pada periode penelitian diperoleh
dengan menghitung sensitivitas, spesifisitas, dan
Volume 2 Nomor 1 Januari 2012
Spes
(%)
akurasi. (Tabel 5) AuROC curve adalah 0,912. Hal
ini menunjukkan bahwa akurasi dari APACHE II
score sangat baik. (Gambar 1)
Sedangkan hasil diskriminasi dari SOFA score
yang dilakukan pada pasien yang dirawat di ICU
RSHS dengan AuROC curve adalah 0,951. (Gambar
2 dan Tabel 6)
Hasil kalibrasi APACHE II score yang dilakukan
pada pasien yang dirawat di ICU RSHS pada periode
penelitian dengan menggunakan uji Lameshow
Hosmer goodness of fit adalah p = 0,239 dengan uji
chi-kuadratnya = 5,506. ( Table 7)
Hasil kalibrasi dari SOFA score yang dilakukan
pada pasien yang dirawat di ICU RSHS pada
periode penelitian dengan menggunakan uji
Lameshow–Hosmer goodness of fit dan didapatkan
hasil kalibrasinya adalah p = 0,450 dengan uji chikuadratnya = 2,641. (Tabel 8)
Hubungan subvariabel SOFA score terhadap
mortalitas pasien yang dirawat di ICU berdasarkan
analisis regresi logistik ganda. Dari keenam organ
yang menjadi standar penilaian dalam SOFA score,
hanya subvariabel koagulasi yang mempunyai nilai
p=0,227 yang menunjukkan bahwa subvariabel
ini kurang bermakna terhadap mortalitas pasien.
Dari subvariabel SOFA score ini diketahui bahwa
yang sangat berpengaruh adalah subvariabel
15
Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif
Tabel 6: Klasifikasi SOFA score
No
POD
(%)
1
2
3
4
5
6
> 2
≤ 2
> 7
≤ 7
> 18
≤ 18
> 26
≤ 26
> 46
≤ 46
> 86
≤ 86
Keluaran
Hidup
Mati
(n=96)
(n=36)
29
67
8
88
1
95
0
96
0
96
0
96
Sens
(%)
Spes.
(%)
36
100
68,8
0
30
83,3
91,7
6
18
50
98,9
8
10
27,8
100
26
7
19,4
100
29
0
0
100
36
NP (+)
(%) NP(-)
(%)
Akurasi
(%)
55,4
100
78,0
78,9
93,6
89,4
94,7
92,2
85,6
100
78,7
80,3
87,5
76,6
78,0
0
72,7
72,7
Keterangan: AuROC (95% ) = 0,951 (0,918 – 0,984)
Sens = Sensitivitas NP (+) = Nilai Prediksi Positif
Spes = Spesifisitas NP (-) = Nilai Prediksi Negatif
Gambar 2: Grafik AuROC dari SOFA score
kardiovaskular (p=0,001), respirasi (p=0,002),
neurologi (p=0,005), hepar (p=0,03), dan ginjal
(p=0,04). Artinya, kenaikan dari subvariabel
kardiovaskular sebesar 1 unit akan meningkatkan
mortalitas pasien sebesar 3,956%, dengan nilai
keakuratannya sebesar 90,15%. (Tabel 9)
PEMBAHASAN
Sistem penilaian untuk kegagalan fungsi organ
dirancang terutama sebagai perangkat deskriptif yang
ditujukan dalam menetapkan suatu standardisasi
definisi untuk stratifikasi dan perbandingan status
pasien di ICU, juga dapat dipergunakan secara
statistis untuk menyesuaikan analisis untuk
karakteristik dasar pada penelitian-penelitian kohort,
untuk menentukan definisi dalam subkelompok, dan
16
perbandingan langsung disfungsi organ di antara
kelompok-kelompok sebagai hasil sekunder pada
penelitian-penelitian acak.7
Karakterisitik pasien pada penelitian ini
menunjukan bahwa tidak ada perbedaan yang bermakna
antara pasien laki-laki dan perempuan dengan nilai
p=0,434. Artinya, bahwa subjek penelitian tidak
membedakan jenis kelamin. Hal ini menunjukkan
bahwa apabila dilakukan penilaian sistem skoring,
jenis kelamin tidak akan mempengaruhi hasil
akhir penelitian secara bermakna. Faktor usia pada
subjek penelitian menunjukkan perbedaan yang
bermakna (p=0,004). Semakin tua seseorang maka
semakin besar pula mortalitasnya, dengan usia ratarata yang meninggal adalah 51,4 (18,5) tahun dan
usia rata-rata yang hidup adalah 40,5 (18,4) tahun.
Lama perawatan juga menunjukkan perbedaan yang
bermakna (p=0,004). Pasien yang meninggal ratarata dirawat selama 8,4 (11,0) hari dan pasien yang
hidup rata-rata dirawat selama 4,3 (4,6) hari. (Tabel
1)
Dari jenis tindakan (pembedahan elektif,
emergensi, atau non-bedah) terdapat pula perbedaan
yang bermakna (p<0,001). Pasien non-bedah
mempunyai nilai persentase mortalitas yang tinggi
sebesar 48%, sedangkan pasien yang menjalani
pembedahan emergensi memiliki nilai persentase
mortalitas sebesar 31,8%, dan yang menjalani
pembedahan elektif hanya 12,1%, sedangkan pada
pasien-pasien pasca bedah saraf tidak ada yang
meninggal dunia.
Pasien bedah yang dirawat di ICU pada periode
penelitian paling banyak, yakni sebanyak 50%, pasien
Majalah Kedokteran Terapi Intensif
Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri
Tabel 7: Lameshow – Hosmer Goodnees of fit APACHE II score
Hidup
POD (%)
Jumlah
8
15
25
40
55
27
53
31
14
7
Keterangan: x2 = 5,506
Keluaran
Prediksi
27
50
17
2
0
df = 4
26,533
49,264
19,246
0,936
0,022
Mati
Outcome
Prediksi
0
3
14
12
7
0,467
3,736
11,754
13,064
6,978
p = 0,239
Tabel 8: Lameshow – Hosmer Goodnees of fit SOFA score
POD (%)
0
7
18
26
46
86
Jumlah
27
40
27
19
12
7
Keterangan:
x2 = 2,641
Hidup
Mati
Keluaran
Prediksi
Outcome
27
40
21
7
1
0
26,379
38,523
23,900
6,567
0,631
0
0
0
6
12
11
7
df = 3
Prediksi
0,621
1,477
3,100
12,433
11,369
7,000
p = 0,450
Tabel 9: Hubungan antara sub-variabel SOFA score terhadap mortalitas berdasarkan analisis regresi
logistik ganda
Sub-variabel SOFA
Neurologi
Kardiovaskular
Respirasi
Koagulasi
Hepar
Ginjal
Koef β
SE(β)
Nilai p
OR
1,312
1,375
1,182
0,476
0,695
0,665
0,470
0,323
0,375
0,393
0,312
0,320
0,005
0,001
0,002
0,227
0,026
0,037
3,715
3,956
3,262
1,609
2,005
1,945
Keterangan: Akurasi model= 90,15%
Keof β = Koefisien regresi
SE(β) = Standar Error
OR = Odds Ratio
bedah saraf dan kebidanan masing-masing 14,4%,
pasien dari bagian penyakit dalam 10,6%, pasien
bagian ortopedi dan traumatologi 6,8%, dan pasien
dari bagian saraf 3,8%. Akan tetapi, karakteristik
subjek penelitian berdasarkan asal pasien dirawat
bagian ini tidak bermakna, hal ini membuktikan
bahwa pasien-pasien yang dirawat di ICU RSHS
sangat bervariasi.
Perbedaan APACHE II score dan SOFA score
sangat bermakna (p < 0,05) (Tabel 3). Nilai untuk
APACHE II score dengan hasil akhir perawatan
Volume 2 Nomor 1 Januari 2012
pasiennya meninggal adalah 20,2 (4,4) dan hasil
akhir perawatan pasiennya hidup adalah 11,9 (3,7),
sedangkan nilai untuk SOFA score pada pasien yang
meninggal adalah 8,3 (3,1) dan pasien yang hidup
2,8 (1,9). Nilai rata-rata POD APACHE II score
dengan akhir perawatan pasiennya meninggal adalah
35,0 (12,7), sedangkan nilai rata-rata SOFA score
adalah 33,5 (27,9), yang secara statistik perbedaan
keduanya sangat bermakna (p < 0,05).
Pada pasien yang masuk ke ICU dengan jumlah
nilai APACHE II score lebih dari 21 (dengan POD
17
Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif
40%) atau nilai SOFA score lebih dari 9 (dengan
POD 26%), kemungkinan meninggal lebih besar.
Begitu juga sebaliknya, jika pasien yang masuk ke
ICU dengan jumlah nilai APACHE II score kurang
dari 12 (dengan POD 15%) atau nilai SOFA score
kurang dari 3 (POD 2%), kemungkinan hidup pada
pasien ini lebih besar.
Berdasarkan bukti adanya hubungan korelasi
antara sistem APACHE II score dan sistem SOFA
score, baik hubungan antara nilai APACHE II– SOFA
score maupun POD APACHE II – SOFA score, (Tabel
4) maka kedua sistem penilaian ini dapat dilakukan
perbandingan.
Sejumlah parameter fisiologi digunakan untuk
mendefinisikan disfungsi organ, yaitu paru-paru,
kardiovaskular, ginjal, hati, hematologi, dan sistem
saraf pusat adalah organ yang umumnya digunakan
untuk penilaian dari disfungsi atau gagal organ pada
pasien yang dirawat di ICU.6,9 Disfungsi organ ini
diduga disebabkan karena tidak adekuatnya pasokan
oksigen untuk memenuhi kebutuhan metabolisme,
jika keadaan ini berlangsung lama maka akan
berakibat pada kegagalan beberapa organ.27 Deskripsi
pada disfungsi sistem kardiovaskular dinilai dengan
tekanan arteri merata, rasio tekanan parsial oksigen
arteri dan fraksi inspirasi oksigen (PaO2/FiO2) untuk
sistem pernapasan, konsentrasi serum kreatinin untuk
sistem ginjal, konsentrasi serum bilirubin untuk
hepar, hitung trombosit untuk sistem hematologi,
dan GCS untuk sistem saraf pusat.22 Disfungsi organ
rata-rata terjadi pada hari ke-2 yaitu diawali dengan
disfungsi neurologis, respirasi, kardiovaskuler, ginjal,
koagulasi dan terakhir hepar.28
Pada penelitian ini dapat diketahui bahwa yang
sangat berpengaruh adalah kardiovaskular, respirasi,
neurologi, hepar, ginjal dan koagulasi. Setiap
kenaikan sebesar 1 unit variabel kardiovaskuler akan
meningkatkan mortalitas pasien sebesar 3,956%,
dengan nilai keakuratannya sebesar 90,15%.
Disfungsi organ adalah proses yang berjalan
dinamis. Karenanya, evaluasi terhadap disfungsi
organ setiap waktu selama perawatan di ICU sangat
membantu dalam mengikuti perkembangan penyakit
dan dapat memberikan gambaran korelasi yang
kuat dengan hasil akhir dari perawatan di ICU.
Penilaian disfungsi sistem organ juga bermanfaat
dalam mengidentifikasi pasien-pasien yang tidak
memberikan respons dalam pengobatan yang telah
diberikan selama beberapa hari sehingga terapi
intensif dapat dipertimbangkan tidak memberikan
manfaat.7,18
Derajat gangguan fisiologis yang muncul saat
pasien masuk ICU merupakan faktor yang potensial
18
untuk melihat angka survival di ICU dan kelainan
fungsi organ yang ireversibel adalah skala mortalitas
yang paling menonjol. Pengukuran formal untuk
derajat keparahan gangguan fisiologis atau evolusi
dari disfungsi organ dari waktu ke waktu tidak
selalu dapat diterapkan secara individual pada
pasien-pasien di ICU. Bagaimanapun, validasi dari
sistem penilaian telah memberikan nilai yang tidak
terhingga yang dibuktikan dalam menggambarkan
populasi pasien dan menaksir angka morbiditas di
ICU pada kelompok-kelompok pasien tertentu.7
Kurva ROC untuk APACHE II score, dengan
AuROC adalah 0,912, sedangkan kurva ROC untuk
SOFA score, dengan AuROC adalah 0,951(Gambar 2
dan 3). Nilai AuROC adalah nilai diskriminasi sistem
penilaian. Hal ini berarti bahwa APACHE II dan SOFA
score mempunyai nilai diskriminasi yang sangat
baik karena suatu sistem penilaian dikatakan cukup
baik jika mempunyai nilai AuROC > 0,7. Semakin
besar nilai AuROC suatu sistem penilaian, semakin
besar pula kemampuan diskriminasi sistem penilaian
tersebut. Nilai AuROC=1 menunjukan bahwa sistem
penilaian mempunyai kemampuan prediksi yang
sempurna dan AuROC = 0,5 menunjukkan bahwa
persentase kebenaran dan persentase kesalahan
dalam memprediksi adalah sama.12,15,24,25,26
Pada penelitian di ICU RSHS pada tahun 2004,
diperoleh diskriminasi dari APACHE II score
sebesar 0,76 yang dibandingkan dengan LODS yang
nilai diskriminasinya sebesar 0,79.17 Masalah pada
penelitian tersebut adalah pengambilan sampel yang
bersifat retrospektif, sehingga jumlah sampel yang
dikeluarkan sangat besar karena data pasien yang
tidak lengkap (sebanyak 194 pasien dikeluarkan
dari 573 pasien) dan pada lembar observasi sering
tidak tergambar data tentang alasan seorang pasien
harus mendapat obat-obat inotropik, vasokonstriktor
atau antiaritmia. Kesulitan lain yang dilaporkan
adalah perhitungan PaO2 dan FiO2. Nilai PaO2 saat
itu belum tentu merupakan nilai yang sesuai dengan
pemberian FiO2 sehingga mempengaruhi ketepatan
nilai. Penilaian GCS pasien juga sulit ditentukan,
karena GCS pasien hanya berdasarkan data dari
lembar observasi, sehingga pengaruh obat-obatan
sedasi tidak tercatat sehingga hal ini mempengaruhi
nilai GCS yang sebenarnya. Untuk penilaian penyakit
kronis diragukan karena dari lembar observasi tidak
ditemukan data tentang penyakit kronis pasien,
demikian pula data tentang pasien benar-benar
menjalani operasi emergensi tidak ada. Data yang
ada hanya menyebutkan bahwa pasien datang dari
ruang operasi 24 jam, ruang operasi elektif, ruang
resusitasi atau dari ruang perawatan.17
Majalah Kedokteran Terapi Intensif
Aris Sunaryo, Ike Sri Redjeki, Tatang Bisri
Masalah tersebut berusaha dihilangkan pada
penelitian ini dengan pengambilan sampel (n=132)
yang bersifat prospektif. Jumlah subyek yang
dikeluarkan sebanyak 2 pasien karena pulang paksa,
6 pasien berusia < 18 tahun dan 20 pasien dirawat
kurang dari 24 jam pertama di ICU. Pasien-pasien
yang dirawat < 24 jam pertama di ICU tidak dapat
dimasukkan dalam penelitian ini karena persyaratan
penilaian untuk APACHE II score adalah setelah
pasien dirawat > 24 jam di ICU. Penelitian ini adalah
penelitian observasional longitudinal, yaitu peneliti
mengikuti perkembangan pasien hingga keluar dari
ICU. Sehingga alasan pemberian obat-obat inotropik,
vasokonstrtriktor dan antiaritmia dapat diketahui oleh
peneliti. Perhitungan PaO2 dan FiO2 dapat dilakukan
karena nilai FiO2 yang diberikan saat pengambilan
AGD dapat diketahui. Penilaian GCS pada penelitian
ini dilakukan dengan menghentikan pemberian obatobatan sedasi beberapa jam sebelum penilaian,
sehingga pengaruh dari obat sedasi terhadap GCS
dapat dikurangi. Data tentang penyakit kronis
pasien, didapatkan dari anamnesis keluarga pasien,
sedangkan untuk mengetahui pasien telah menjalani
operasi emergensi atau elektif peneliti mencatat saat
pasien tersebut masuk ke ICU.
Hasil kalibrasi APACHE II score pada periode
penelitian dengan uji Lameshow – Hosmer goodness
of fit menunjukkan hasilnya adalah p = 0,239 dengan
uji chi-kuadratnya = 5,506 (Tabel 7), sedangkan hasil
kalibrasi dari SOFA score pada periode penelitian
dengan uji Lameshow – Hosmer goodness of fit dan
didapatkan hasil kalibrasinya adalah p = 0,450 dengan
uji chi-kuadratnya = 2,641(Tabel 8). Pada penelitian
di RSHS pada tahun 2004, diperoleh kalibrasi dari
APACHE II score dengan uji chi-kuadrat sebesar 7,
40,08.
Kesimpulan
SOFA Score lebih akurat dalam memperkirakan
mortalitas pasien-pasien di ICU RSUP Hasan Sadikin
Bandung, karena mempunyai nilai diskriminasi dan
kalibrasi yang lebih baik dibandingkan APACHE II
Score.
DAFTAR PUSTAKA
1. Shortell SM, Zimmerman JE, Rouseau DM. The
performance of intensive care unit : does good
management make difference. Med Care. 1994;
32: 508-25.
2. Cullen DJ, Chernow B. Predicting outcome in
critically ill patients. Crit Care Med. 1994; 22:
1345-8.
Volume 2 Nomor 1 Januari 2012
3. Knaus WA, Draper EA, Wagner DP, Zimmerman
JE. APACHE II: a severityof disease classification system. Crit Care Med. 1985; 13: 818-29.
4. Le Gall JR, Lemeshow S, Saulnier F. A new simplified acute physiology score (SAPS II) based
on a European/North American multicenter
study. JAMA. 1993; 270: 2957-63.
5. Lemeshow S, Teres D, Avrunin JS, Gage RW.
Refining intensive care unit outcome prediction
by using changing probabilities of mortality. Crit
Care Med. 1988; 16: 470-7.
6. Ferreire FL, Bota DP, Bross A, Mélot C, Vincent JL. Serial evaluation of the SOFA score to
predict outcome in critically ill patients. JAMA.
2001; 286: 1754-8.
7. Marshall JC. Multiple organ dysfunction syndrome. Crit Care Med. 2003; 8: 1-20.
8. Le Gall JR, Klar J, Lameshow S, Saulnier F, Albert C. The logistic organ dysfungtion system: A
new way to assess organ dysfunction in the ICU.
JAMA. 1996; 802-10.
9. Tran DD, Groeneveld ABJ, Vander Muelen J,
Nauta JJP, Strack VS, Thijs LG. Age, chronic
disease, sepsis, organ system failure, and mortality in a medical intensive care unit. Crit Care
Med. 1990; 18:474-9.
10. Deitch EA. Multiple organ failure: pathophysiology and potential future therapy. Ann Surg.
1992; 216: 117-34.
11. Sakr C, Sphonholz, Reinhart K. Organ dysfunction in the ICU: a clinical perspective. In: Vincent JL, ed. 2007 Yearbook of intensive care and
emergency medicine. New York: Springer; 2007.
p. 238-43.
12. Gregoire G, Russell JA. Assessment of severity
of illness. In: Principles of critical care. 2nd ed.
USA: Mc Graw-Hill; 1998. p.57-67.
13. APACHE II accessed: 15 April 2008. Available
from: http://en.wikipedia.org/wiki/APACHE _II
14. Gunning K, Rowan K. Outcome data and scoring system. BMJ. 1999; 319: 241-4.
15. Lemeshow S, Le Gall JR. Modeling the severity of illness of ICU patients. JAMA. 1994; 272:
1094-55.
16. Whitelly SM, Bodenham A, Bellany MC. Intensive care. Philadelphia: Elsevier; 2006. p. 7-11.
17. Nuraini, Redjeki IS, Bisri T. Perbandingan validasi logitic organ dysfunction system (LODS)
score dan APACHE II ditinjau dari diskriminasi
dan kalibrasi. FKUP, Bandung, 2004.
18. Johnson D, Mayers I. Multile organ dysfunction
syndrome: a narrative review. Neuroanesthesia
and Intensive Care. 2001; 5: 502-9.
19
Perbandingan Validasi APACHE II dan SOFA Score untuk Memperkirakan Mortalitas Pasien yang Dirawat di Ruang Perawatan Intensif
19. Shann F. Mortality prediction model is preferable
to APACHE as an intensive care scoring system.
BMJ. 1999; 320: 714.
20. Shann F, Pearson G, Slater A, Wilkinson K.
Paediatric index of mortality (PIM): a mortality
prediction model for children in intensive care.
Intensive Care Med. 1997; 23: 201-07.
21. Bosman RJ, Oudemans SHM, Zandstra DF. The
use of intensive care information systems alters
outcome prediction. Intensive Care Med. 1998;
24: 953-58.
22. Sakr C, Sphonholz, Reinhart K. Organ dysfunction in the ICU: a clinical perspective. In: Vincent JL, ed. 2007 Yearbook of intensive care and
emergency medicine. New York: Springer; 2007.
p. 238-43.
23. Vincent JL, Moreno R, Takala J. SOFA score
to describe organ dysfunction/failure. Intensive
Care Med. 1996; 22: 707-10.
24. Simon S. ROC. Children’s Mercy Hospital &
Clinics. 18 Agustus 1999. Accessed: 23 April
20
2008. Available from: http://www.childrensmercy.org.
25. Liu H, Li G, Cumberland WG, Wu T. Testing
statistical significance of the area under a receiving operating characteristics curve for repeated
measures design with bootstrapping. J of data
science. 2005;3: 257-8.
26. Mandrekar JN, Mandrekar SJ. Statistical methods in diagnostic medicine using SAS@sofware.
SAS institute. Accessed 26 Apr 2008. Available
from: http://ftp.sas.com/techsup/download/stat/
roc.html.
27. Bakker J, deLima AP. Increased blood lactate
levels: An important warning signal in surgical
practice. Crit Care Med. 2004; 8: 96-7.
28. Marshall JC, Cook DJ, Christou NV, Bernard
GR, Sprung C, Sibbad WJ. Multiple organ dysfunction score: A reliable descriptor of a complex clincal outcome. Crit Care Med. 1995; 23:
1638-52.
Majalah Kedokteran Terapi Intensif
Download