pemodelan kematian yang diakibatkan oleh

advertisement
PEMODELAN KEMATIAN YANG DIAKIBATKAN OLEH
PEMBUNUHAN DAN BUNUH DIRI DI LITHUANIA
PADA TAHUN 2003-2004
RIDWAN FIRDAUS
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Pemodelan Kematian
yang Diakibatkan oleh Pembunuhan dan Bunuh Diri di Lithuania pada Tahun
2003-2004 adalah benar karya saya dengan arahan dari komisi pembimbing dan
belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, April 2014
Ridwan Firdaus
NIM G5408002
ABSTRAK
RIDWAN FIRDAUS. Pemodelan Kematian yang Diakibatkan oleh Pembunuhan
dan Bunuh Diri di Lithuania pada Tahun 2003-2004. Dibimbing oleh I WAYAN
MANGKU dan RUHIYAT.
Banyak permasalahan dalam kehidupan sehari-hari yang dapat dimodelkan
dengan suatu proses stokastik. Proses stokastik memegang peranan cukup penting,
salah satunya untuk memodelkan variasi geografis dari risiko kematian. Makalah
ini mempertimbangkan masalah numerik dari model pendekatan Bayes empiris
diterapkan pada estimasi tingkat kecil. Kondisi untuk nonsingularitas pendugaan
Bayes diberikan dan juga dikembangkan. Model Gauss-Poisson bisa digunakan
untuk kemungkinan peristiwa dalam populasi yang sama, jika penggerombolan
terdapat kemungkinan yang kecil. Jika ukuran populasi tidak diperhitungkan,
maka pendugaan risiko relatif (RR) yang hanya berdasarkan pada beberapa kasus
dapat menghasilkan peta yang tidak baik. Penduga Bayes empiris terbukti
memiliki kesalahan kuadrat lebih kecil daripada penduga RR. Pengintegralan dan
pemaksimuman fungsi likelihood dilakukan dengan menggunakan perangkat
lunak matematika. Pada karya ilmiah ini penulis mempelajari tulisan dari
Sakalauskas (2010) yang berjudul On the Empirical Bayesian Approach for the
Poisson-Gaussian Model.
Kata kunci: Bayes empiris, model Gauss-Poisson, pemodelan kematian
ABSTRACT
RIDWAN FIRDAUS. Modeling Homicide and Suicide Mortalities in Lithuania in
2003-2004. Supervised by I WAYAN MANGKU and RUHIYAT.
Many daily problems can be assumed as stochastic processes. Therefore
stochastic processes are very important subjects. One of them is modeling the
geographical variation of mortality risk. This paper considers numerical issues of
the empirical Bayesian approach model applied to the low rate estimation. The
condition for nonsingularity of Bayesian estimation is given and the convenient
iterative algorithm for the estimation is described. The clustering algorithm is also
developed. It uses the property of Poisson-Gaussian model to treat probabilities of
events in populations being the same, if the variance of probabilities is small. If
the population size is not taken into account, then the estimation of relative risk
(RR), which is only based on a few cases to produce a map, is not good. Empirical
Bayes estimation has been proven to have smaller squared error than that of RR
estimator. Integrating and maximizing likelihood functions is done by using a
mathematical software. This paper refers mainly to the paper of Sakalauskas
(2010) entitled On the Empirical Bayesian Approach for the Poisson-Gaussian
model.
Key words: Empirical Bayesian, mortality modeling, Poisson-Gaussian model
PEMODELAN KEMATIAN YANG DIAKIBATKAN OLEH
PEMBUNUHAN DAN BUNUH DIRI DI LITHUANIA
PADA TAHUN 2003-2004
RIDWAN FIRDAUS
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains
pada
Departemen Matematika
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Judul Skripsi : Pemodelan Kematian yang Diakibatkan oleh Pembunuhan dan
Bunuh Diri di Lithuania pada Tahun 2003-2004
Nama
: Ridwan Firdaus
NIM
: G54080023
Disetujui oleh
Prof Dr Ir I Wayan Mangku, MSc
Pembimbing I
Diketahui oleh
Dr Toni Bakhtiar, MSc
Ketua Departemen
Tanggal Lulus:
Ruhiyat, MSi
Pembimbing II
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah Subhanahu Wa Ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Maret 2012 ini ialah
Pemodelan Kematian yang Diakibatkan oleh Pembunuhan dan Bunuh Diri di
Lithuania pada Tahun 2003-2004
Terima kasih penulis ucapkan kepada Prof Dr Ir I Wayan Mangku, MSc dan
Ruhiyat, MSi selaku pembimbing, serta Dr Ir Hadi Sumarno MS yang telah
banyak memberi saran. Ungkapan terima kasih juga disampaikan kepada ayah,
ibu, serta seluruh keluarga, atas segala doa dan kasih sayangnya.
Semoga karya ilmiah ini bermanfaat.
Bogor, April 2014
Ridwan Firdaus
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan
1
TINJAUAN PUSTAKA
2
Ruang Contoh, Kejadian dan Peluang
2
Peubah Acak dan Fungsi Sebaran
3
Nilai Harapan dan Ragam
4
Kekonvergenan Peubah Acak
5
Statistik, Penduga dan Sifat-sifatnya
5
Sebaran Prior dan Sebaran Posterior
6
Proses Stokastik
7
Proses Poisson
7
Metode Maximum Likelihood (ML)
8
HASIL DAN PEMBAHASAN
Model Gauss-Poisson
9
9
Turunan dari Fungsi Likelihood dan Persamaan Titik Tetap
10
Pendugaan Parameter Gauss dengan Metode “Iterasi Sederhana”
13
Aplikasi untuk Penggerombolan
13
Implementasi untuk Analisis Data
14
SIMPULAN
16
DAFTAR PUSTAKA
16
LAMPIRAN
18
RIWAYAT HIDUP
22
DAFTAR TABEL
1 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan
di Lithuania, 2003
2 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan
di Lithuania, 2004
3 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun
2003 untuk wilayah Shilutes d, Shirvintu d, Kaunas, dan Kauno d
15
15
16
DAFTAR LAMPIRAN
1 Bukti Teorema 1
2 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun
2003
18
20
1
PENDAHULUAN
Latar Belakang
Banyak permasalahan dalam kehidupan sehari-hari yang dapat dimodelkan
dengan suatu proses stokastik. Proses stokastik merupakan model yang berkaitan
dengan aturan-aturan peluang. Proses stokastik memegang peranan cukup penting
dalam berbagai bidang, salah satunya untuk memodelkan variasi geografis dari
risiko kematian dalam upaya untuk menunjukkan bahwa suatu kejadian tertentu
dapat disebabkan oleh faktor risiko yang memiliki struktur spasial.
Proses stokastik dibedakan menjadi dua berdasarkan jenis waktu, yaitu
proses stokastik dengan waktu diskret dan proses stokastik dengan waktu kontinu.
Pada tulisan ini, pembahasan hanya dibatasi pada proses stokastik dengan waktu
kontinu. Salah satu bentuk khusus dari proses stokastik dengan waktu kontinu
adalah model Gauss-Poisson.
Pada tulisan ini masalah yang dimodelkan adalah kematian yang diakibatkan
oleh pembunuhan dan bunuh diri. Model ini diharapkan dapat membantu pihak
yang berkepentingan, seperti petugas kepolisian. Tingkat kriminalitas ini biasanya
berbeda-beda untuk setiap wilayah, sehingga dibutuhkan kebijakan yang tepat
dalam menanganinya.
Jika keragaman ukuran populasi tidak diperhitungkan, maka pendugaan
risiko relatif (RR) yang hanya berdasarkan pada beberapa kasus dapat
menghasilkan peta yang tidak baik. Penduga Bayes empiris terbukti memiliki
kesalahan kuadrat yang lebih kecil daripada penduga RR. Dalam hal ini,
banyaknya kejadian memenuhi sebaran Poisson, bergantung pada laju kejadian
dan waktu pengamatan untuk setiap populasi.
Dalam tulisan ini dibahas aspek numerik dari pendugaan Bayes empiris
untuk model Gauss-Poisson, ketika sebaran prior logit adalah normal dengan
parameter diduga dengan metode maximum likelihood (ML) (Tsutakava et al.
1985; Sakalauskas 1995). Di sini ditentukan kondisi nonsingularitas dalam
pendugaan parameter dari sebaran prior dan digunakan algoritme iteratif
sederhana untuk menduga prior sebelumnya. Karena pendekatan Bayes empiris
untuk model Gauss-Poisson membedakan dengan sifat untuk membuat peluang
kejadian dalam populasi menjadi sama, ketika banyaknya kejadian tidak bervariasi
banyak, digunakan algoritme gerombol yang mengeksploitasi sifat ini. Data
kematian Lithuania pada tahun 2003-2004 digunakan untuk menduga risiko yang
sebenarnya dan menunjukkan penggunaan pendekatan tersebut.
Pada karya ilmiah ini penulis mempelajari tulisan dari Sakalauskas (2010)
yang berjudul On the Empirical Bayesian Approach for the Poisson-Gaussian
Model.
Tujuan
1. Mempelajari dan menganalisis model kematian yang diakibatkan oleh
pembunuhan dan bunuh diri di Lithuania pada tahun 2003-2004.
2. Mempelajari variasi geografis dari risiko kematian dalam upaya untuk
menunjukkan bahwa suatu kejadian tertentu dapat disebabkan oleh faktor
risiko yang memiliki struktur spasial.
2
TINJAUAN PUSTAKA
Ruang Contoh, Kejadian dan Peluang
Dalam suatu percobaan sering kali diperlukan pengulangan yang dilakukan
dalam kondisi yang sama. Semua kemungkinan hasil yang akan muncul akan
diketahui tetapi hasil pada percobaan selanjutnya tidak dapat diduga dengan tepat.
Percobaan semacam ini disebut percobaan acak.
Definisi 1 (Ruang contoh)
Ruang contoh adalah himpunan semua hasil yang mungkin dari suatu percobaan
acak dan dinotasikan dengan Ω (Grimmett & Stirzaker 1992).
Definisi 2 (Kejadian)
Kejadian adalah suatu himpunan bagian dari ruang contoh Ω (Grimmett &
Stirzaker 1992).
Definisi 3 (Medan- )
Medan- adalah suatu himpunan yang anggotanya terdiri atas himpunan bagian
ruang contoh Ω, yang memenuhi syarat berikut:
1.

2. Jika
, maka
Ai
i 1
3. Jika
, maka
Jika
, maka medan- disebut medan Borel. Anggota medan Borel disebut
himpunan Borel (Hogg et al. 2005).
Definisi 4 (Kejadian saling lepas)
Kejadian dan disebut saling lepas jika irisan dari keduanya adalah himpunan
kosong
(Grimmett & Stirzaker 1992).
Definisi 5 (Ukuran peluang)
Misalkan Ω adalah ruang contoh suatu percobaan dan adalah medan- pada Ω.
Suatu fungsi yang memetakan unsur-unsur ke himpunan bilangan nyata ,
atau
disebut ukuran peluang jika
1. taknegatif, yaitu untuk setiap
2. bersifat aditif takhingga, yaitu jika
dengan
∑
maka ⋃
3. bernorma satu, yaitu
.
Pasangan
disebut ruang ukuran peluang atau ruang peluang (Hogg et al.
2005).
Definisi 6 (Kejadian saling bebas)
Kejadian dan dikatakan saling bebas jika:
Secara umum, himpunan kejadian {
} dikatakan saling bebas jika:
3
(⋂
)
∏
untuk setiap himpunan bagian J dari I (Grimmett & Stirzaker 1992).
Peubah Acak dan Fungsi Sebaran
Definisi 7 (Peubah acak)
Misalkan
adalah medan- dari ruang contoh
suatu fungsi
dengan sifat bahwa {
(Grimmett & Stirzaker 1992).
Suatu peubah acak adalah
}
untuk setiap
Peubah acak dinotasikan dengan huruf kapital, misalnya
peubah acak dinotasikan dengan huruf kecil seperti
memiliki fungsi sebaran.
, sedangkan nilai
. Setiap peubah acak
Definisi 8 (Fungsi sebaran)
Misalkan adalah suatu peubah acak dengan ruang contoh . Misalkan kejadian
, maka peluang dari kejadian adalah:
Fungsi
disebut fungsi sebaran dari peubah acak
(Hogg et al. 2005).
Definisi 9 (Peubah acak diskret)
Peubah acak dikatakan diskret jika semua himpunan nilai
dari peubah
acak tersebut merupakan himpunan tercacah (Grimmett & Stirzaker 1992).
Definisi 10 (Fungsi massa peluang)
Fungsi massa peluang dari peubah acak diskret
yang diberikan oleh
adalah fungsi
(Hogg et al. 2005).
Definisi 11 (Peubah acak kontinu)
Peubah acak dikatakan kontinu jika fungsi sebarannya dapat ditulis sebagai
∫
untuk suatu fungsi
yang dapat diintegralkan. Selanjutnya fungsi
disebut fungsi kepekatan peluang bagi (Hogg et al. 2005).
Definisi 12 (Peubah acak Poisson)
Suatu peubah acak disebut peubah acak Poisson dengan parameter ,
fungsi massa peluangnya diberikan oleh
untuk
(Ross 2007).
jika
4
Definisi 13 (Sebaran gamma)
Peubah acak dengan fungsi kepekatan peluang
jika
{
lainnya
dikatakan memiliki sebaran gamma dengan parameter
(Gahramani 2005).
Definisi 14 (Sebaran normal)
Suatu peubah acak disebut memiliki sebaran normal dengan nilai harapan dan
ragam , ditulis menyebar
, jika fungsi kepekatan peluangnya adalah
√
{
(
) }, untuk
(Hogg et al. 2005).
Lema 1 (Jumlah peubah acak Poisson)
Misalkan dan adalah peubah acak yang saling bebas dan memiliki sebaran
Poisson dengan parameter berturut-turut
dan , maka
memiliki sebaran
Poisson dengan parameter
. Bukti dapat dilihat pada Taylor & Karlin
(1984).
Nilai Harapan dan Ragam
Definisi 15 (Nilai harapan)
1. Jika adalah peubah acak diskret dengan fungsi massa peluang
nilai harapan dari , dinotasikan dengan
, adalah
, maka
∑
asalkan jumlah di atas konvergen mutlak.
2. Jika adalah peubah acak kontinu dengan fungsi kepekatan peluang
maka nilai harapan dari adalah
,
∫
asalkan integral di atas konvergen mutlak (Hogg et al. 2005).
Definisi 16 (Ragam)
Misalkan adalah peubah acak diskret dengan fungsi massa peluang
dan
nilai harapan
. Ragam dari , dinotasikan dengan
atau , adalah
∑(
)
(Hogg et al. 2005).
Definisi 17 (Fungsi indikator)
Misalkan adalah suatu kejadian. Fungsi indikator dari
{ } yang diberikan oleh
adalah suatu fungsi
5
{
jika
jika
(Grimmett & Stirzaker 1992).
Kekonvergenan Peubah Acak
Terdapat beberapa cara untuk menginterpretasikan pernyataan kekonvergenan
barisan peubah acak.
Definisi 18 (Konvergen dalam peluang)
Misalkan
adalah barisan peubah acak pada suatu ruang peluang
. Barisan peubah acak
dikatakan konvergen dalam peluang ke ,
|
dinotasikan
, jika untuk setiap
berlaku |
, untuk
(Grimmett & Stirzaker 1992).
Definisi 19 (Konvergen dalam sebaran)
Misalkan
adalah peubah acak pada suatu ruang peluang
. Suatu
barisan peubah acak
dikatakan konvergen dalam sebaran ke peubah acak ,
ditulis
, untuk
jika
untuk
, untuk semua titik x di mana fungsi sebaran
(Grimmett & Stirzaker 1992).
adalah kontinu
Statistik, Penduga dan Sifat-sifatnya
Definisi 20 (Statistik)
Statistik adalah suatu fungsi dari satu atau lebih peubah acak yang tidak
bergantung pada satu atau beberapa parameter yang nilainya tidak diketahui
(Hogg et al. 2005).
Definisi 21 (Penduga)
Misalkan
adalah contoh acak. Suatu statistik
yang
digunakan untuk menduga fungsi parameter
, disebut penduga bagi
,
dilambangkan dengan ̂
Bilamana nilai
maka nilai
disebut sebagai dugaan bagi
(Hogg et al. 2005).
Definisi 22 (Penduga takbias)
1. Suatu penduga yang nilai harapannya sama dengan parameter
disebut penduga takbias bagi
2. Jika
penduga takbias asimtotik bagi
(Hogg et al. 2005).
maka
Definisi 23 (Penduga konsisten)
Suatu penduga yang konvergen dalam peluang ke parameter
penduga konsisten bagi
(Hogg et al. 2005).
yaitu
disebut
, disebut
6
Sebaran Prior dan Sebaran Posteriror
Definisi 24 (Sebaran Prior)
Suatu peubah acak
dengan parameter
memiliki fungsi kepekatan peluang
bersyarat yang dinotasikan dengan
|
dan
adalah fungsi
kepekatan marjinal dari , dinamakan sebaran prior (Arnold 1990).
Definisi 25 (Sebaran Posterior)
Suatu peubah acak merupakan sebaran prior dengan fungsi kepekatan peluang
bersyarat
| dan memiliki fungsi kepekatan peluang
, maka
fungsi kepekatan peluang bersama dari
dinotasikan dengan
|
, dinamakan sebaran posterior, dinyatakan dengan
|
|
|
∫
(Arnold 1990).
Proses Stokastik
Definisi 26 (Proses stokastik)
{
Proses stokastik
memetakan suatu ruang contoh
} adalah suatu himpunan dari peubah acak yang
ke suatu ruang state
(Ross 2007).
Jadi untuk setiap pada himpunan indeks
adalah suatu peubah acak.
Indeks sering diinterpretasikan sebagai waktu dan
sebagai state (keadaan)
dari proses pada waktu
Definisi 27 (Proses stokastik waktu kontinu)
Suatu proses stokastik disebut proses stokastik dengan waktu kontinu jika
berupa suatu interval (Ross 2007).
Definisi 28 (Inkremen bebas)
Suatu proses stokastik dengan waktu kontinu {
} disebut memiliki
inkremen bebas jika untuk semua
peubah acak
adalah bebas (Ross 2007).
Dengan kata lain, suatu proses stokastik dengan waktu kontinu disebut memiliki
inkremen bebas jika proses berubahnya nilai pada interval waktu yang tidak
tumpang tindih (tidak overlap) adalah bebas.
Definisi 29 (Inkremen stasioner)
Suatu proses stokastik dengan waktu kontinu
{
} disebut memiliki
inkremen stasioner jika
memiliki sebaran yang sama untuk
semua nilai (Ross 2007).
Dengan kata lain, suatu proses stokastik dengan waktu kontinu disebut memiliki
inkremen stasioner jika sebaran dari perubahan nilai antara sembarang dua titik
hanya tergantung pada jarak antara kedua titik tersebut dan tidak bergantung pada
lokasi titik-titik tersebut.
7
Proses Poisson
Salah satu bentuk khusus dari proses stokastik dengan waktu kontinu adalah
proses Poisson. Pada tulisan ini dianggap bahwa himpunan indeks
adalah
interval bilangan real taknegatif yaitu
Definisi 30 (Proses pencacahan)
} disebut proses pencacahan jika
Suatu proses stokastik {
menyatakan banyaknya kejadian yang telah terjadi sampai waktu
Dari definisi tersebut, maka suatu proses pencacahan
harus memenuhi
syarat-syarat berikut:
1.
untuk semua
2. Nilai
adalah bilangan bulat.
3. Jika
maka
untuk
4. Untuk
maka
sama dengan banyaknya kejadian yang terjadi
pada interval
(Ross 2007)
Definisi 31 (Proses Poisson)
} disebut proses Poisson dengan laju ,
Suatu proses pencacahan {
jika dipenuhi tiga syarat berikut:
1.
.
2. Proses tersebut memiliki inkremen bebas.
3. Banyaknya kejadian pada sembarang interval waktu dengan panjang
memiliki sebaran Poisson dengan nilai harapan
Jadi untuk setiap
,
dengan
(Ross 2007).
Dari syarat (3) dapat dilihat bahwa proses Poisson memiliki inkremen stasioner.
Dari syarat (3) juga dapat diperoleh
(
)
Proses Poisson dengan laju yang merupakan konstanta untuk semua waktu
disebut proses Poisson homogen. Jika laju bukan konstanta, tetapi merupakan
fungsi dari waktu , maka proses tersebut disebut proses Poisson takhomogen.
Untuk kasus ini,
disebut fungsi intensitas dari proses Poisson tersebut.
Fungsi intensitas
harus memenuhi syarat
untuk semua
Misalkan adalah proses Poisson dan adalah suatu interval bilangan nyata. Jika
adalah proses Poisson homogen, maka
| |
dengan | | adalah panjang interval , sedangkan
menyatakan banyaknya
kejadian dari proses Poisson pada interval
Jika
adalah proses Poisson takhomogen dengan fungsi intensitas
∫
, maka
8
Dengan kata lain, jika
sifat:
adalah proses Poisson takhomogen, maka
memiliki
1.
untuk setiap interval dengan
2. Untuk setiap bilangan bulat positif
dan
yang saling lepas dengan ( )
merupakan peubah acak yang saling bebas.
adalah interval
Metode Maximum Likelihood (ML)
Defenisi 32 (Fungsi likelihood)
Misalkan
adalah barisan peubah acak independent and identically
distributied (i.i.d) dengan fungsi kepekatan peluang
, dengan
diasumsikan skalar dan tidak diketahui, maka fungsi likelihood dapat dituliskan
sebagai berikut:
∏
dengan
(Hogg et al. 2005).
Definisi 33 (Pendugaan maximum likelihood)
∏
Misalkan
adalah fungsi likelihood, maka fungsi log dari
, dapat dinotasikan dengan:
∑
Pendugaan parameter dengan metode maximum likelihood dapat diperoleh dengan
menentukan nilai yang memaksimumkan fungsi
atau
(Hogg
et al. 2005).
9
HASIL DAN PEMBAHASAN
Model Gauss-Poisson
(
) dari
Misalkan suatu himpunan
populasi, di mana
setiap populasi
terdiri atas
individu. Asumsikan beberapa kejadian
(misalnya kematian yang diakibatkan oleh beberapa kasus bunuh diri) dapat
terjadi pada populasi amatan. Tujuan dari tulisan ini adalah untuk menduga
peluang kejadian
yang tidak diketahui, ketika banyaknya kejadian
dalam
populasi yang diamati,
. Karena risiko relatif
tidak dapat
digunakan dalam banyak kasus akibat perbedaan yang besar dalam ukuran
populasi , maka pendekatan Bayes empiris diterapkan.
Banyaknya kejadian
diasumsikan mengikuti sebaran Poisson dengan
parameter
, yaitu:
( )
(
)
( )
Asumsi ini sering dibenarkan (Bradley et al. 2000; Tsutakava et al. 1985; Clayton
dan Kaldor 1987).
Metode Bayes empiris adalah prosedur dua tahap, bergantung pada sebaran
prior yang diperkenalkan pada tahap kedua (Bradley et al. 2000). Hal yang
menarik pada model adalah logit
menyebar normal dengan parameter
. Dengan demikian, fungsi kepekatan
peluang dari logit pada persamaan (2) adalah:
(
)
(
)
(
)
Kemudian tingkat
yang diberikan
√
dievaluasi sebagai suatu nilai harapan posterior untuk
) (
(
∫
(
)
)
di mana
(
)
∫
(
) (
)
adalah peluang posterior dari banyaknya kejadian pada populasi ke- ,
.
Analisis Bayes dalam statistik sering berhubungan dengan peminimuman
fungsi tertentu, dinyatakan sebagai integral dari fungsi kepekatan posterior.
Dengan demikian, dalam pendekatan Bayes empris dengan parameter
yang
tidak diketahui diduga dengan metode maximum likelihood. Fungsi logaritma
likelihood, setelah beberapa manipulasi didapatkan sebagai berikut
10
(
)
∑
( (
∑
(∫
))
) (
(
)
)
yang harus diminimumkan untuk mendapatkan dugaan bagi parameter
.
Turunan dari Fungsi Likelihood dan Persamaan Titik Tetap
Fungsi likelihood pada persamaan (6) dapat diturunkan terhadap parameter
dan turunan pertama masing-masing fungsi ini adalah sebagai berikut:
(
)
[ ∑
∑*
∑[
∑
∫
)
)
(
)
(
))]
( (
(
∫
(
(
( (
(
)
(
)
)
(
)
√
) (
(
∑[
)
(
[ ∑
(
)
(
)
∫
∑*
))+
)
]
(
)
)
]
)
(
∑
(
( (
)
))]
( (
∫
)
(
))+
)
(
11
∑[
(
∫
)
(
)(
√
∑
(
(
∫
(
(
)
)
√
)
(
)
)
) (
) (
(
(
(
)
)
]
)
)
Dengan menyamakan persamaan (7) dan (8) dengan nol, yaitu
(
)
(
)
maka diperoleh persamaan titik tetap untuk penduga ML dari
berikut:
(
)
∑
[∑
∑
∫
∫
(
) (
(
(
(
(
∫
) (
(
(
)
)
(
(
)
)
∑
) (
(
(
)
)
(
) (
∑
) (
]
)
)
)
(
∫
∑
∫
) (
)
(
∫
∑
(
) (
(
)
(
)
(
∫
)
∫
∑
∑
∑
) (
sebagai
)
)
)
(
∑
) (
(
∫
dan
)
)
)
)
12
(
∑
∑
(
) (
) (
)
∑
)
(
(
∑
)
(
) (
(
∫
(
(
∫
)
)
)
∑
∑
∑
)
) (
(
(
)
)
) (
(
)
(
)
)
) (
(
)
)
) (
(
)
)
(
(
∫ (
∫ (
)
∫ (
∫ (
)
)
)
Namun, solusi dari persamaan ini hanya ada di bawah asumsi
nonsingularitas dari penduga ML untuk
(yaitu,
). Setelah beberapa
analisis tentang persamaan (6), (7), (8), sampailah pada teorema berikut.
Teorema 1 Solusi dari persamaan (11) dan (12) ada jika
∑(
)
∑
Bukti dapat dilihat pada Lampiran 1.
Jika persamaan (13) tidak terpenuhi, penduga ML adalah:
di mana
∑
∑
Ini mengikuti dari kondisi persamaan (13) bahwa singularitas terjadi paling
sering pada populasi kecil. Oleh karena itu, kondisi ini dapat digunakan untuk
membuat populasi diatur dengan kejadian langka.
Sangat mudah untuk memastikan bahwa dalam kasus singularitas (
)
banyak kejadian tetap untuk semua populasi,
Nilai yang bersesuaian fungsi likelihood adalah:
(
)
∑(
(
))
∑
(
(
))
13
Pendugaan Parameter Gauss dengan Metode “Iterasi Sederhana”
Studi empiris dari fungsi likelihood dengan berbagai koleksi ukuran populasi
dan banyaknya kasus dalam populasi memungkinkan untuk disimpulkan bahwa
fungsi ini unimodal dan memiliki satu titik minimum.
Dengan demikian, kondisi nonsingularitas pada persamaan (13) adalah
benar. Kemudian solusi persamaan (9), (10) atau (11), (12) dapat ditentukan
dengan metode numerik. Misalnya, metode “iterasi sederhana” (Kantorovich dan
Akilov 1982) berguna untuk menyelesaikan persamaan-persamaan tersebut
sehingga diperoleh penduga ML dari dan ,
∑
∑
Titik awal (
) (
(
∫
(
∫ (
)
)
)
) (
(
(
)
)
) dari persamaan (18) dan (19) dapat dipilih
∑
∑(
)
dengan
Pendugaan ML untuk
dapat juga ditentukan dengan Metode Matriks
Variabel (Dennis dan Schnabel 1996), dengan menggunakan titik awal pada
persamaan (20) dan (21) serta menggunakan persamaan (7) dan (8) untuk
memperkirakan gradien fungsi likelihood.
Perhatikan bahwa integral dalam persamaan (5), (6), (7), (8), (11), (12), (18),
dan (19) dapat dihitung dengan menggunakan, misalnya, formula kuadratur
Hermite-Gauss (Abramovich dan Stegun 1968).
Selain itu, pengintegralan dan peminimuman fungsi ML dapat dilakukan
dengan menggunakan alat yang tepat dalam perangkat lunak matematika.
Aplikasi untuk Penggerombolan
Pendekatan Bayes empiris telah diterapkan untuk memetakan
penggeromboralan (Knorr-Held dan Rasser (1999), Bradley et al. (2000)). Sifat
model Gauss-Poisson untuk menangani populasi dengan rasio relatif tertutup satu
sama lain dan memiliki peluang kejadian yang sama dapat diterapkan untuk
14
memetakan penggerombolan. Perhatikan sebuah himpunan gerombol
yang
terdiri atas himpunan populasi
(
). Perhatikan bahwa
diperlukan sebagai gerombol himpunan bagian dari populasi yang bersebelahan
(yaitu, setiap populasi di gerombol memiliki perbatasan bersama dengan beberapa
penduduk lainnya dari gerombol ini), di mana kondisi ragam nol yang berasal dari
persamaan (13) adalah benar:
∑(
)
(
) adalah himpunan gerombol yang mencakup
Misalkan
semua himpunan populasi
,
,
Himpunan penggerombolan dipilih sehingga fungsi likelihood persamaan (6)
menjadi minimum. Jadi, dengan menggunakan persamaan (17) setelah beberapa
manipulasi sederhana dapat dipastikan bahwa himpunan penggerombolan terbaik
harus menghasilkan fungsi minimum
∑
( ) ∑ ∑
(
)
∑
Peluang kejadian yang bersesuaian dengan populasi pada suatu gerombol
adalah
∑
∑
Perhatikan bahwa banyaknya gerombol yang mungkin agak besar dan harus
dilihat melalui banyaknya gerombol yang besar, ketika himpunan
penggerombolan dibentuk sehubungan dengan persamaan (23). Penyederhanaan
heuristik dapat diterapkan dengan menggunakan proposisi berikut.
Proposisi 1 Misalkan
, dan ukuran ,
(
dan
adalah dua populasi dengan banyaknya kejadian
, maka
)
(
)
( )
( )
Bukti dari proposisi ini diperoleh dengan manipulasi dasar.
Dengan demikian dari persamaan (25), penggabungan dua gerombol
menyebabkan fungsi likelihood menurun. Sifat ini dapat digunakan untuk
penentuan himpunan penggerombolan terbaik. Dengan memulai dari himpunan
penggerombolan awal, yang terdiri atas gerombol yang masing-masing hanya
memiliki satu populasi, dua gerombol digabung jika kondisi pada persamaan (22)
tetap berlaku dalam gerombol yang digabung dan penurunan fungsi likelihood
minimum di antara semua kombinasi penggabungan yang mungkin, dan prosedur
ini diulang sampai berakhir.
Implementasi untuk Analisis Data
Metode yang dikembangkan diterapkan untuk analisis data kematian yang
diakibatkan oleh pembunuhan dan bunuh diri di Lithuania pada tahun 2003-2004
(semua kejadian dalam populasi, untuk pria dan wanita). Pengintegralan dan
peminimuman fungsi likelihood dilakukan dengan menggunakan perangkat lunak
matematika.
15
Hasil analisis kondisi nonsingularitas persamaan (13) dan pendugaan Bayes
empiris dari peluang kejadian diberikan pada Tabel 1 dan Tabel 2.
Tabel 1 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan di
Lithuania, 2003
∑
Semua bunuh diri
Semua pembunuhan
Pria bunuh diri
Pembunuhan Pria
Wanita bunuh diri
Pembunuhan wanita
41.656
9.44
74.582
14.431
13.952
5.45
(
)
⁄
∑
14255.1/1434=9.941
453.3/325=1.395
9484.2/1199=7.910
356.0/232=1.543
692.9/256=2.705
76.8/100=0.768
-7.652
-9.260
-7.7074
-8.840
-8.826
-9.817
0.281
0.136
0.288
0.159
0.371
0
Tabel 2 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan di
Lithuania, 2004
∑
Semua bunuh diri
Semua pembunuhan
Pria bunuh diri
Pembunuhan Pria
Wanita bunuh diri
Pembunuhan wanita
40.334
8.587
70.337
12.515
14.075
5.093
(
)
⁄
∑
15421/1381=11.166
287/294=0.976
11889/1124=10.577
313/2001=1.565
1573.2/257=6.121
84.1/93=0.904
-7.652
-9.260
-7.7074
-8.840
-8.826
-9.817
0.281
0
0.305
0.234
0.257
0
Pada Tabel 1 dan 2 jika Teorema 1 terpenuhi maka dilanjutkan dengan
iterasi sederhana untuk mendapatkan dan setelah itu disubstitusi ke persamaan
(4). Apabila Teorema 1 tidak terpenuhi maka digunakan pesamaan (14) dan (15).
Dengan demikian, singularitas dalam sebaran prior, yaitu ragam prior nol
diamati untuk beberapa kejadian langka (pembunuhan wanita pada tahun 20032004, dan semua pembunuhan pada tahun 2004).
RR untuk kasus bunuh diri dan peluang kejadian diduga dengan metode
Bayes empiris maupun dengan pendekatan penggerombolan disajikan pada
Lampiran 2. Dengan demikian, dapat dilihat penurunan ragam penduga Bayes
empiris dibandingkan dengan RR.
16
Tabel 3 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun 2003
untuk wilayah Shilutes d, Shirvintu d, Kaunas, dan Kauno d
Wilayah
Penduduk
Pria ( )
Shilutes d
Shirvintu d
Kaunas
Kauno d
26257
9392
167308
39525
Banyaknya RR
Bunuh diri Bunuh
diri
( )
( )
22
83.79
10
106.47
85
50.80
18
45.54
Bayes
empiris
Bunuh
diri ( )
84.506
94.815
54.077
57.698
Penggerombolan
Bayes empiris
Bunuh diri
84.406
84.406
56.682
56.682
Perbandingan peluang kejadian dengan menggunakan RR antara Shilutes d
dan Shirvintu d cukup besar, sedangkan dengan menggunakan Bayes empiris
perbandingannya lebih kecil. Begitu juga dengan wilayah Kaunas dan kauno d
perbandingan peluang kejadian dengan menggunakan bayes empiris lebih kecil
dibandingkan dengan menggunakan RR, sehingga pada tulisan ini digunakan
penduga Bayes empiris untuk menentukan peluang kejadian. Peluang kejadian
dengan menggunakan RR pada wilayah Kaunas lebih besar dibandingkan Kauno
d, sedangkan dengan menggunakan Bayes empiris wilayah Kaunas lebih kecil
dibandingkan dengan Kauno d.
SIMPULAN
Masalah yang dimodelkan adalah kematian yang diakibatkan oleh
pembunuhan dan bunuh diri. Model ini diharapkan dapat membantu pihak yang
berkepentingan, seperti petugas kepolisian. Tingkat kriminalitas ini biasanya
berbeda-beda untuk setiap wilayah, sehingga dibutuhkan kebijakan yang tepat
dalam menanganinya.
Jika keragaman ukuran populasi tidak diperhitungkan, maka pendugaan
risiko relatif dapat digunakan. Namun, karena risiko relatif tidak dapat digunakan
dalam banyak kasus akibat perbedaan yang besar dalam ukuran populasi, maka
pendekatan Bayes empiris diterapkan.
Studi empiris dari fungsi likelihood dengan berbagai koleksi ukuran populasi
dan banyaknya kasus dalam populasi memungkinkan untuk fungsi ini memiliki
satu titik tetap.
Perbandingan peluang kejadian dua wilayah dengan menggunakan RR lebih
besar dibandingkan dengan menggunakan Bayes empiris.
DAFTAR PUSTAKA
Abramovich M, Stegun IA. 1968. Handbook of Mathematical Functions. New
York (US): Dover.
Arnold SF. 1990. Mathematical Statistics. New Jersey (US): Prentice Hall, Inc.
17
Bradley PC, Thomas AL, Bradley C. 2000. Bayes and empirical Bayes methods
for data analysis. Springer. 7(2):153-154. doi: 10.1023/A:1018577817064.
Clayton D, Kaldor J. 1987. Empirical Bayes estimates of age-standardized relative
risks for use in disease mapping. Biometrics. 43(3):671-681.
Dennis JE, Schnabel RB. 1996. Numerical Methods for Unconstrained
Optimization and Nonlinear Equations (Classics in for Applied Mathematics).
Philadelphia (US): SIAM.
Gahramani S. 2005. Fundamentals of Probability with Stochastic Processes. Ed
ke-3. New Jersey (US): Pearson Prentice Hall.
Grimmett GR, Stirzaker DR. 1992. Probability and Random Processes. Ed ke-2.
Oxford (UK): Clarendon Press.
Hogg RV, Craig AT, McKean JW. 2005. Introduction to Mathematical Statistics.
Ed ke-6. New Jersey (US): Prentice Hall.
Kantorovich LV, Akilov GP. 1982. Functional Analysis. Oxford (UK): Pergamon
Press.
Knorr-Held L, Rasser G. 1999. Bayesian Detection of Clusters and
Discontinuities in Disease Maping. Munich (DE): Departement of Munich.
University of Munich.
Ross SM. 2007. Introduction to Probability Models. Ed ke-9. Orlando, Florida
(US): Academic Press.
Sakalauskas L. 1995. On Bayes analysis of small rates in medicine. Proc. of the
Intern. Conf. “Computer Data Analysis and Modeling”. 1:127-130. Minsk
(BLR): Belarusia State University.
Sakalauskas L. 2010. On the empirical Bayesian approach for the PoissonGaussian model. Springer Science. 12:247-259. doi: 10.1007/s11009-0099146-2.
Taylor HM, Karlin. 1984. An Introduction to Stochastics Modelling. Orlando,
Florida (US): Academic Press Inc.
Tsutakava RK, Shoop GL, Marienfield CJ. 1985. Empirical Bayes estimation of
cancer mortality rates. Stat. Med. 4:201-212. doi:10.1002/sim.4780040210.
18
Lampiran 1 Bukti Teorema 1
Misalkan:
( )
( )
(
(1A)
( )
( ))
(
)
(
(2A)
)
Untuk memastikan bahwa
(
*
( ) (
(
)
(
*
(
(3A)
*
( )
*
(
(
*
)
(
( )
*
(
( )
((
⏟
)
*(
(
*+
( )
⏟
(
( )
)
(
( )
( )
(
(
)
(
((
((
)
(
(
)
*(
(
maka diperoleh persamaan (4A)
*
*
*(
( )) + (
( ))
) (
( ) (
*
(
)
*
( )
)
*
(4A)
*
*
( )
(
( ) (
*
) (
*
19
Perhatikan bahwa
(
)
(
)
(5A)
Sekarang, dengan menggunakan ekspansi Taylor dari fungsi (1) dan
mempertimbangkan (5A), kita memperoleh limit derivatif (7) dari fungsi
likelihood sehubungan dengan saat mendekati nol:
(
)
∑
∑
(
∫
(
)
(
)) (
(
( )
∑
(
)
( )
(
∫
)*
(
* (
)
)
∑(
*
(6A)
Jadi berdasarkan (6A) dan persamaan (8), kita mendapatkan penduga maximum
likelihood:
∑
(7A)
∑
Analog, mari kita menghitung limit derivatif (8) dari fungsi likelihood sehubungan
dengan , saat mendekati nol:
(
)
(
(
∑
(
∫ (
∑
( )
)
∑
) (
(
(
∫
∑
(
)*
[(
)
(
)* (
(
[(
)
]
)
+
]
)
]
(8A)
Solusi taknol
dari persamaan (9) ada hanya jika
Dengan menyubtitusi (7A) ke (8A) diperoleh pertaksamaan
∑
* (
)
( )
( ))
[(
,
( )
(
∑
)
)
( )
)(
(
∑
*(
)
(
)
.
+
(9A)
yang menyebabkan kondisi (13).
20
Lampiran 2 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun 2003
Wilayah (j)
Akmenes d (1)
Alytaus d (2)
Alytus (3)
Anykshchiu d (4)
Birshtono m (5)
Birzu d (6)
Shakiu d (7)
Shalchininku d (8)
Shiauliai (9)
Shiauliu d (10)
Shilales d (11)
Shilutes d (12)
Shirvintu d (13)
Druskininku m (14)
Shvenchioniu d (15)
Elektrenu d (16)
Ignalinos d (17)
Jonavos d (18)
Jonishkio d (19)
Jurbarko d (20)
Kaishiadoriu d (21)
Kalvariju d (22)
Kaunas (23)
Kauno d (24)
Kazlu Ruda d (25)
Kedainiu d (26)
Kelmes d (27)
Klaipeda (28)
Klaipedos d (29)
Kretingos d (30)
Kupishkio d (31)
Lazdiju d (32)
Marijampoles m (33)
Mazeikiu d (34)
Moletu d (35)
Neringa (36)
Pagegiu d (37)
Pakruojo d (38)
Palanga (39)
Panevezio r (40)
Panevezys (41)
Penduduk
pria ( )
Banyaknya
Bunuh diri
( )
RR
Bunuh
diri
( )
Bayes
empiris
Bunuh
diri ( )
Penggerombolan
Bayes empiris
Bunuh diri
13920
15741
34085
16099
2467
16462
18271
18534
60221
24563
15183
26257
9392
11543
15174
13644
10578
24587
14815
17627
18366
6556
167308
39525
7037
30590
19334
88308
22598
21776
11366
12788
33536
31594
11899
1212
5770
13855
8062
20587
53913
10
12
17
19
4
12
17
15
43
20
15
22
10
8
7
17
14
16
15
20
13
9
85
18
2
31
20
45
17
26
11
14
30
37
15
1
10
11
8
24
26
71.84
76.23
49.88
118.02
162.14
72.90
93.04
80.93
71.40
81.42
98.79
83.79
106.47
69.31
46.13
124.60
132.35
65.08
101.25
113.46
70.78
137.28
50.80
45.54
28.42
101.34
103.44
50.96
75.23
119.40
96.78
109.48
89.46
117.11
126.06
82.51
173.31
79.39
99.23
116.58
48.23
79.315
81.059
61.649
103.871
99.451
79.199
90.054
83.200
74.207
83.074
92.867
84.506
94.815
78.976
66.782
106.126
107.419
73.091
94.103
101.846
77.664
103.989
54.077
57.698
68.865
96.571
96.325
56.582
79.467
107.071
91.168
97.725
88.329
108.116
105.566
87.421
114.788
82.951
91.415
104.829
57.253
99.883
89.358
89.358
99.883
89.358
84.406
56.682
89.358
84.406
84.406
84.406
84.406
84.406
89.358
45.896
89.358
74.285
56.682
84.406
84.406
89.358
89.358
56.682
56.682
56.682
84.406
84.406
84.406
84.406
113.549
99.883
89.358
89.358
84.406
84.406
84.406
84.406
84.406
84.406
84.406
84.406
21
Pasvalio d (42)
Plunges d (43)
Prienu d (44)
Radvilishkio d (45)
Raseiniu d (46)
Rietavo d (47)
Rokishkio d (48)
Skuodo d (49)
Taurages d (50)
Telshiu d (51)
Traku d (52)
Ukmerges d (53)
Utenos d (54)
Varenos d (55)
Vilkavishkio d (56)
Vilniaus d (57)
Vilnius (58)
Visagino m (59)
Zarasu d (60)
16365
20967
16714
24469
20562
5044
19442
12099
24604
26855
17400
22335
23205
14611
23786
43452
246412
13653
10498
13
18
15
25
21
13
21
11
19
22
14
23
29
25
21
23
110
4
6
79.44
85.85
89.75
102.17
102.13
257.73
108.01
90.92
77.22
81.92
80.46
102.98
124.97
171.10
88.29
52.93
44.64
29.30
57.15
82.622
85.912
88.126
96.396
95.754
141.063
99.126
88.538
80.459
83.280
83.048
96.589
111.323
134.156
87.398
61.963
47.495
60.778
74.574
84.406
113.549
89.358
84.406
84.406
113.549
84.406
113.549
84.406
84.406
89.358
84.406
99.883
89.358
56.682
45.896
45.896
74.285
99.883
22
RIWAYAT HIDUP
Penulis dilahirkan di Bunga Tanjung Kabupaten Tanah Datar pada tanggal 31
Desember 1989. Anak dari pasangan Mawardi dan Warnida merupakan anak ketujuh
dari tujuh bersaudara. Penulis menyelesaikan pendidikan Sekolah Dasar di SDN 15
Bunga Tanjung Kabupaten Tanah Datar pada tahun 2002, Sekolah Menengah Pertama
di MTsN Pitalah Kabupaten Tanah Datar pada tahun 2005, Sekolah Menengah Atas di
MAN Sumpur Kabupaten Tanah Datar pada tahun 2008, dan pada tahun yang sama
penulis lulus seleksi masuk Institut Pertanian Bogor melalui jalur Undangan Seleksi
Masuk IPB dan diterima di Departemen Matematika, Fakultas Matematika dan Ilmu
Pengetahuan Alam.
Selama perkuliahan, penulis juga aktif di beberapa organisasi kampus, yaitu
Gugus Mahasiswa Matematika (GUMATIKA) pada tahun 2009-2010, penulis aktif
sebagai anggota Badan Pengawas Gumatika (BPG).
Download