1 ESTIMASI PARAMETER DISTRIBUSI LOG

advertisement
Universitas Hasanuddin
ESTIMASI PARAMETER DISTRIBUSI LOG-LOGISTIK
PADA DATA SURVIVAL TERSENSOR TIPE II
Ryndha1, Anna2, Nasrah3
ABSTRAK
Data survival adalah data yang menunjukkan waktu suatu individu atau objek dapat bertahan
hingga terjadinya suatu kegagalan atau kejadian tertentu. Pada makalah ini, dibahas mengenai
estimasi parameter distribusi log-logistik pada data survival tersensor tipe II dengan metode
penaksir maksimum likelihood estimator. Selanjutnya diterapkan pada data simulasi pasien
penyakit ginjal kronik (PGK) tahun 2014 yang berdistribusi Log-logistik. Penelitian ini bertujuan
untuk mengetahui peluang pasien untuk dapat bertahan hidup. Berdasarkan hasil olah data simulasi
diperoleh peluang hidup pasien yang menderita PGK selama 150 bulan adalah 0,254, sedangkan
untuk pasien yang menderita PGK selama 50 bulan peluang hidupnya jauh lebih tinggi yaitu
sebesar 0,659.
Kata Kunci: Distribusi Log-logistik, Data tersensor tipe II, Maksimum Likelihood Estimator
1.
Pendahuluan
Perkembangan ilmu pengetahuan saat ini, khususnya di bidang statistika,
menghasilkan penemuan-penemuan alat analisis yang dapat digunakan untuk
menganalisis suatu permasalahan. Salah satunya adalah analisis uji hidup yang digunakan
untuk meneliti daya tahan hidup suatu unit atau individu pada suatu keadaan tertentu.
Analisis yang digunakan untuk menganalisis data waktu hidup tersebut disebut analisis
survival. Analisis survival mencakup survival time (waktu tahan hidup) atau failure time
(Collet, 1997).
Terdapat dua cara yang dapat dilakukan dalam pengambilan sampel pada analisis
data tahan hidup yaitu pengamatan tersensor dan pengamatan tidak tersensor
(pengamatan lengkap). Pengamatan tidak tersensor merupakan pengamatan yang diambil
jika semua individu atau unit data yang diteliti mati atau gagal sampai jangka waktu yang
ditentukan. Pengamatan tersensor dilakukan jika waktu tahan hidup dari individu yang
diamati tidak diketahui secara pasti. Pengamatan tersensor diindikasi adanya individu
yang tetap hidup sampai jangka waktu yang ditentukan (Lee, 2003).
Ada tiga jenis penyensoran dalam pengamatan terhadap waktu tahan hidup yaitu
sensor tipe I, sensor tipe II dan sensor tipe III. Sebagian besar penelitian menggunakan
penyensoran tipe II karena waktu pengamatan dapat dihentikan setelah diperoleh
sebanyak r kegagalan, sehingga peneliti dapat menghemat waktu dan biaya.
Analisis data survival yang menggunakan data tersensor diperlukan asumsi tertentu
tentang distribusi populasinya. Adapun dalam tulisan ini digunakan fungsi survival
berdistribusi Log-Logistik pada data survival tersensor tipe II. Dalam bidang kesehatan,
distribusi Log-logistik dapat digunakan untuk meneliti data tahan hidup pasien. Misalnya
pada pasien penderita penyakit ginjal kronik (PGK).
2.
2.1
Tinjauan Pustaka
Data Survival
Data survival adalah data yang menunjukkan lamanya individu-individu atau unitunit dari suatu populasi menjalankan fungsinya dengan baik sampai kegagalan individuindividu tersebut. Kleinbaum (2005) mengemukakan bahwa ada tiga elemen yang perlu
diperhatikan dalam menentukan waktu survival, antara lain:
1
Universitas Hasanuddin
a. Time origin atau starting point (titik awal) adalah waktu dimulainya suatu
penelitian
b. Ending event of interest (kejadian akhir) adalah kejadian yang menjadi inti dari
penelitian.
c. Measurement scale for the passage of time, yaitu skala ukuran untuk berlalunya
waktu.
Waktu ketahan hidup (T) merupakan variabel random non-negatif yang mewakili
ketahanan hidup dari individu-individu dalam populasi yang merupakan variabel random
kontinu dalam interval
atau ketahanan hidup pada waktu t dengan t>0 (Lawless,
1982). Untuk mengetahui ketahanan hidup dapat diperoleh dengan mengestimasi
distribusi fungsi-fungsi ketahanan hidupnya. Distribusi waktu ketahanan hidup dapat
dinyatakan oleh tiga fungsi yang ekuivalen yaitu fungsi survival,fungsi Hazard, dan
fungsi kepadatan peluang.
Fungsi kepadatan peluang f(t) adalah yang didefinisikan sebagai limit probabilitas
individu gagal dalam interval periodik t sampai
, atau lebih mudahnya ialah
probabilitas kegagalan dalam sebuah interval pendek perunit waktu yang didefinisikan
sebagai berikut:
(
*
(
(
+
(
*
(
+
Fungsi survival adalah peluang bahwa suatu individu akan tetap hidup sampai
waktu t (t >0). Jika T merupakan variabel random dari waktu tahan hidup suatu individu,
maka S(t) adalah peluang bahwa T lebih besar dari t.
(
(
(
Fungsi Hazard menyatakan peluang kegagalan suatu individu pada waktu t, jika
diketahui bahwa individu tersebut tetap hidup hingga waktu t.
(
2.2
*
(
+
Data Tersensor
Data tersensor adalah data yang diperoleh sebelum semua data teramati waktu
hidupnya, sementara waktu pengamatan telah berakhir. Menurut Lee dan Wang (2003),
ada tiga tipe penyensoran yang sering digunakan dalam pengamatan uji hidup yaitu
sebagai berikut:
1. Sensor Tipe I, merupakan tipe penyensoran dimana percobaan akan dihentikan
setelah mencapai waktu T yang telah ditentukan untuk mengakhiri semua n
individu yang masuk pada waktu yang sama. Berakhirnya waktu uji T
menjelaskan waktu sensor uji. Dengan kata lain, jika terdapat individu yang
hilang secara tiba-tiba maka waktu survival observasi tersensor sama dengan
lama waktu pengamatan.
2. Sensor Tipe II, merupakan tipe penyensoran dimana sampel ke-r merupakan
observasi terkecil dalam sampel random berukuran n (
Dari total
sampel berukuran n, pengamatan akan dihentikan ketika diperoleh sebanyak r
individu yang mengalami kegagalan, dimana r<n.
3. Sensor Tipe III, individu atau unit uji masuk ke dalam penelitian pada waktu
yang berbeda-beda selama periode waktu penelitian.
2
Universitas Hasanuddin
2.3
Distribusi Log-Logistik
Distribusi Log-logistik dengan variabel random Y mempunyai fungsi kepadatan
peluang,
(
(
)
(
[
)]
dengan
.
Variabel random T dikatakan mengikuti distribusi Log-logistik dengan parameter
dan , jika mempunyai fungsi kepadatan
( )( )
(
( ) ]
[
Fungsi distribusi kumulatifnya adalah
(
∫
.
Fungsi survival-nya didefinisikan sebagai peluang suatu individu dapat bertahan hidup
sampai waktu t, yaitu
(
(
Fungsi Hazard h(t) menyatakan peluang suatu komponen mengalami kegagalan pada
waktu t, dituliskan sebagai berikut
(
3.
3.1
(
(
(
Hasil dan Pembahasan
Estimasi Parameter Distribusi Log-Logistik pada Data Survival tersensor
Tipe II
Data tersensor tipe II, mempunyai r pengamatan dari n sampel yang diamati, dan
pengamatan akan dihentikan setelah kegagalan ke-r yang terjadi sebelum waktu . Data
terdiri dari r tahan hidup terkecil
dari sampel random yang
terdiri dari n tahan hidup
.
3
Universitas Hasanuddin
Fungsi kepadatan peluang bersama dari
dapat ditulis sebagai berikut:
(
dari data tersensor tipe II
[∏ (
(
(
]
]
Fungsi likelihood dari distribusi Log-logistik untuk data tersensor tipe II memiliki bentuk
sebagai berikut
(
( )
( )∏
(
( ) ] ]
[
[
[
(
]
Dalam mengestimasi parameter distribusi Log-logistik dapat dilakukan dengan
menurunkan fungsi likelihoodnya terhadap
dan
kemudian disamadengankan nol
menjadi.
̂
̂
(
̂
̂
̂
)∑[
̂
( ) ]
̂
( )
̂
(̂ ) ]
(̂)
̂
̂
(
̂
( )
̂
( )( )
̂
̂
(
Dan
̂
∑
̂
∑
[
(̂ )
(
(̂)
(̂)
(̂)
(2)
karena persamaan (1) dan (2) tidak dapat diselesaikan secara langsung, maka untuk
mendapatkan nilai estimasi parameternya dapat menggunakan metode iterasi numerik
atau dengan bantuan software.
3.2
Aplikasi Pada Data
Jenis data yang digunakan adalah data bangkitan dari hasil simulasi pembangkitan
data yang berdistribusi Log-logistik sebanyak 100 data dengan variabel yang digunakan
adalah lama pasien menderita penyakit ginjal kronik (PGK) yang diukur dalam hitungan
bulan.
Dari hasil output Minitab didapatkan nilai parameter dari data adalah 4,32895 dan nilai
dari parameter
adalah 0,631712. Sehingga diperoleh nilai dari parameter ̂ dan ̂
adalah sebagai berikut:
̂
(
(
̂
Dari nilai ̂ dan ̂ yang diperoleh, selanjutnya dibentuk fungsi kepadatan peluang, fungsi
Hazard, dan fungsi survival dari data. Berikut ini adalah bentuk fungsi kepadatan peluang
dari data pasien PGK:
4
Universitas Hasanuddin
(
(
)(
)
(
[
(
)
]
(
)
(
[
)
]
Distribution Overview Plot for C1
ML Estimates-Failure Censored at 71
P robability D ensity F unction
Loglogistic
99
0.0075
90
P DF
P er cent
0.0050
Distribution Overview
Plot for C1
ML Estimates-Failure Censored at 71
0.0025
50
Bentuk fungsi
25
0
500
1000
P er cent
00
0.1
1500
C1
50
S urv iv al F unction
0.012
00
(
(
1
(
[ 10 (
)
100
C1
)
S tatistics
4.32895
0.631712
1164.437 10
100
*
C1
75.8646
113.960 H azard F unction
70
30
164.670
0.008
] 1000
Rate
75
10
Table of
Loglogistic
Loc 1
99
S cale
0.0000
0.1
M ean
0
500
1000
1500
90
S tD ev
C1
Sumber: Hasil olah data, 2014
M edian
Gambar
PGK
501 Kurva fungsi kepadatan peluang dari data pasien
IQ R
S urv iv al F unction
F ailure
Hazard dari10
data pasien PGK:
0.012
100
C ensor
1
A D*
P er cent
P robability D ensity F unction
50
0.004
H azard F unction
0
0
500
1000
1500
0.000
0
500
C1
Rate
0.008
50
0.004
0
0
500
1000
C1
1500
0.000
0
500
1000
1500
C1
Sumber: Hasil olah data, 2014
Gambar 2 Kurva fungsi Hazard dari data pasien PGK
Bentuk fungsi survival dari data pasien PGK:
(
(
1000
C1
)
5
P er
P
0.0025
10
1
0.0000
0
500
1000
Universitas 0.1
Hasanuddin
1500
1
10
C1
S urv iv al F unction
Hazard F unction
0.012
100
0.008
Rate
P er cent
100
C1
50
0.004
0
0
500
1000
1500
0.000
0
500
C1
Sumber: Hasil olah data, 2014
Gambar 3 Kurva fungsi survival dari data pasien PGK
1000
C1
Berdasarkan hasil pengolahan data yang dilakukan, diketahui peluang seorang pasien
untuk bertahan hidup jika mengidap penyakit ginjal kronik (PGK) selama 50 bulan adalah
0,659, selama 90 bulan adalah 0,433, selama 100 bulan adalah 0,392, dan selama 150
bulan adalah 0,254. Dari hasil perhitungan tersebut dapat dilihat bahwa semakin lama
seorang pasien mengidap penyakit ginjal kronik maka peluang hidup pasien tersebut akan
semakin kecil (mendekati nol), hingga akhirnya mengalami kematian. Berkurangnya
ketahanan hidup seorang pasien PGK dipengaruhi oleh banyak faktor, misalnya terdapat
komplikasi penyakit atau perawatan pasien yang kurang memadai sehingga menyebabkan
penyakit yang diderita semakin akut dan akhirnya menyebabkan kematian.
4.
4.1
Kesimpulan dan Saran
Kesimpulan
Dari penerapan distribusi Log-logistik pada data survival tersensor pasien penyakit
ginjal kronik (PGK) dengan simulasi pembangkitan data, diperoleh nilai estimasi
adalah 75,865 dan nilai estimasi untuk adalah 1,583. Dari nilai estimasi yang diperoleh
diketahui peluang hidup seorang pasien yang mengidap PGK selama 50 bulan adalah
0,659, selama 90 bulan adalah 0,433, selama 100 bulan adalah 0,392, dan selama 150
bulan adalah 0,254.
4.2
Saran
Penelitian ini hanya membahas mengenai estimasi parameter distribusi Loglogistik untuk data survival, sehingga disarankan untuk penelitian selanjutnya agar
mengkaji lebih lanjut hingga ketahap estimasi parameter model regresi Log-logistik. Dan
dapat diaplikasikan pada data survival lainnya, terkhusus pada data riil pasien penyakit
ginjal kronik (PGK) untuk mengetahui faktor-faktor yang dapat mempengaruhi ketahanan
hidup dari pasien PGK.
DAFTAR PUSTAKA
Collett, David. 2004. Modelling Survival Data in Medical Research. 2nd ed. London:
Chapman and Hall.
Lawless, J.F. 1982. Statistical Model and Methods for Lifetime data. New Jersey: John
Wiley and Sons, Inc.
Lawless, J.F. 2003. Statistical Model and Methods for Lifetime Data 2nd ed. New Jersey:
John Wiley and Sons Inc.
6
Universitas Hasanuddin
Lee, E.T. 2003. Statistical Methods for Survival Data Analysis 3rd ed. Canada: John
Wiley and Sons Inc.
Marchin, David, Yin Bun C and Mahesh Parmar. 2006. Survival Analysis A Practical
Approach. 2nd. Chiester: John Wiley and Sons Ltd.
Rao, G.S. Kantam and K. Rosaih. 2009. “Realiability Estimation in Log-logistic
Distribution from Cencored Samples”. Prob. Stat.,02,52-67.
7
Download