PEMODELAN KEMATIAN YANG DIAKIBATKAN OLEH PEMBUNUHAN DAN BUNUH DIRI DI LITHUANIA PADA TAHUN 2003-2004 RIDWAN FIRDAUS DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Pemodelan Kematian yang Diakibatkan oleh Pembunuhan dan Bunuh Diri di Lithuania pada Tahun 2003-2004 adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, April 2014 Ridwan Firdaus NIM G5408002 ABSTRAK RIDWAN FIRDAUS. Pemodelan Kematian yang Diakibatkan oleh Pembunuhan dan Bunuh Diri di Lithuania pada Tahun 2003-2004. Dibimbing oleh I WAYAN MANGKU dan RUHIYAT. Banyak permasalahan dalam kehidupan sehari-hari yang dapat dimodelkan dengan suatu proses stokastik. Proses stokastik memegang peranan cukup penting, salah satunya untuk memodelkan variasi geografis dari risiko kematian. Makalah ini mempertimbangkan masalah numerik dari model pendekatan Bayes empiris diterapkan pada estimasi tingkat kecil. Kondisi untuk nonsingularitas pendugaan Bayes diberikan dan juga dikembangkan. Model Gauss-Poisson bisa digunakan untuk kemungkinan peristiwa dalam populasi yang sama, jika penggerombolan terdapat kemungkinan yang kecil. Jika ukuran populasi tidak diperhitungkan, maka pendugaan risiko relatif (RR) yang hanya berdasarkan pada beberapa kasus dapat menghasilkan peta yang tidak baik. Penduga Bayes empiris terbukti memiliki kesalahan kuadrat lebih kecil daripada penduga RR. Pengintegralan dan pemaksimuman fungsi likelihood dilakukan dengan menggunakan perangkat lunak matematika. Pada karya ilmiah ini penulis mempelajari tulisan dari Sakalauskas (2010) yang berjudul On the Empirical Bayesian Approach for the Poisson-Gaussian Model. Kata kunci: Bayes empiris, model Gauss-Poisson, pemodelan kematian ABSTRACT RIDWAN FIRDAUS. Modeling Homicide and Suicide Mortalities in Lithuania in 2003-2004. Supervised by I WAYAN MANGKU and RUHIYAT. Many daily problems can be assumed as stochastic processes. Therefore stochastic processes are very important subjects. One of them is modeling the geographical variation of mortality risk. This paper considers numerical issues of the empirical Bayesian approach model applied to the low rate estimation. The condition for nonsingularity of Bayesian estimation is given and the convenient iterative algorithm for the estimation is described. The clustering algorithm is also developed. It uses the property of Poisson-Gaussian model to treat probabilities of events in populations being the same, if the variance of probabilities is small. If the population size is not taken into account, then the estimation of relative risk (RR), which is only based on a few cases to produce a map, is not good. Empirical Bayes estimation has been proven to have smaller squared error than that of RR estimator. Integrating and maximizing likelihood functions is done by using a mathematical software. This paper refers mainly to the paper of Sakalauskas (2010) entitled On the Empirical Bayesian Approach for the Poisson-Gaussian model. Key words: Empirical Bayesian, mortality modeling, Poisson-Gaussian model PEMODELAN KEMATIAN YANG DIAKIBATKAN OLEH PEMBUNUHAN DAN BUNUH DIRI DI LITHUANIA PADA TAHUN 2003-2004 RIDWAN FIRDAUS Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains pada Departemen Matematika DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 Judul Skripsi : Pemodelan Kematian yang Diakibatkan oleh Pembunuhan dan Bunuh Diri di Lithuania pada Tahun 2003-2004 Nama : Ridwan Firdaus NIM : G54080023 Disetujui oleh Prof Dr Ir I Wayan Mangku, MSc Pembimbing I Diketahui oleh Dr Toni Bakhtiar, MSc Ketua Departemen Tanggal Lulus: Ruhiyat, MSi Pembimbing II PRAKATA Puji dan syukur penulis panjatkan kepada Allah Subhanahu Wa Ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul yang dipilih dalam penelitian yang dilaksanakan sejak bulan Maret 2012 ini ialah Pemodelan Kematian yang Diakibatkan oleh Pembunuhan dan Bunuh Diri di Lithuania pada Tahun 2003-2004 Terima kasih penulis ucapkan kepada Prof Dr Ir I Wayan Mangku, MSc dan Ruhiyat, MSi selaku pembimbing, serta Dr Ir Hadi Sumarno MS yang telah banyak memberi saran. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga, atas segala doa dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat. Bogor, April 2014 Ridwan Firdaus DAFTAR ISI DAFTAR TABEL vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Tujuan 1 TINJAUAN PUSTAKA 2 Ruang Contoh, Kejadian dan Peluang 2 Peubah Acak dan Fungsi Sebaran 3 Nilai Harapan dan Ragam 4 Kekonvergenan Peubah Acak 5 Statistik, Penduga dan Sifat-sifatnya 5 Sebaran Prior dan Sebaran Posterior 6 Proses Stokastik 7 Proses Poisson 7 Metode Maximum Likelihood (ML) 8 HASIL DAN PEMBAHASAN Model Gauss-Poisson 9 9 Turunan dari Fungsi Likelihood dan Persamaan Titik Tetap 10 Pendugaan Parameter Gauss dengan Metode “Iterasi Sederhana” 13 Aplikasi untuk Penggerombolan 13 Implementasi untuk Analisis Data 14 SIMPULAN 16 DAFTAR PUSTAKA 16 LAMPIRAN 18 RIWAYAT HIDUP 22 DAFTAR TABEL 1 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan di Lithuania, 2003 2 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan di Lithuania, 2004 3 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun 2003 untuk wilayah Shilutes d, Shirvintu d, Kaunas, dan Kauno d 15 15 16 DAFTAR LAMPIRAN 1 Bukti Teorema 1 2 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun 2003 18 20 1 PENDAHULUAN Latar Belakang Banyak permasalahan dalam kehidupan sehari-hari yang dapat dimodelkan dengan suatu proses stokastik. Proses stokastik merupakan model yang berkaitan dengan aturan-aturan peluang. Proses stokastik memegang peranan cukup penting dalam berbagai bidang, salah satunya untuk memodelkan variasi geografis dari risiko kematian dalam upaya untuk menunjukkan bahwa suatu kejadian tertentu dapat disebabkan oleh faktor risiko yang memiliki struktur spasial. Proses stokastik dibedakan menjadi dua berdasarkan jenis waktu, yaitu proses stokastik dengan waktu diskret dan proses stokastik dengan waktu kontinu. Pada tulisan ini, pembahasan hanya dibatasi pada proses stokastik dengan waktu kontinu. Salah satu bentuk khusus dari proses stokastik dengan waktu kontinu adalah model Gauss-Poisson. Pada tulisan ini masalah yang dimodelkan adalah kematian yang diakibatkan oleh pembunuhan dan bunuh diri. Model ini diharapkan dapat membantu pihak yang berkepentingan, seperti petugas kepolisian. Tingkat kriminalitas ini biasanya berbeda-beda untuk setiap wilayah, sehingga dibutuhkan kebijakan yang tepat dalam menanganinya. Jika keragaman ukuran populasi tidak diperhitungkan, maka pendugaan risiko relatif (RR) yang hanya berdasarkan pada beberapa kasus dapat menghasilkan peta yang tidak baik. Penduga Bayes empiris terbukti memiliki kesalahan kuadrat yang lebih kecil daripada penduga RR. Dalam hal ini, banyaknya kejadian memenuhi sebaran Poisson, bergantung pada laju kejadian dan waktu pengamatan untuk setiap populasi. Dalam tulisan ini dibahas aspek numerik dari pendugaan Bayes empiris untuk model Gauss-Poisson, ketika sebaran prior logit adalah normal dengan parameter diduga dengan metode maximum likelihood (ML) (Tsutakava et al. 1985; Sakalauskas 1995). Di sini ditentukan kondisi nonsingularitas dalam pendugaan parameter dari sebaran prior dan digunakan algoritme iteratif sederhana untuk menduga prior sebelumnya. Karena pendekatan Bayes empiris untuk model Gauss-Poisson membedakan dengan sifat untuk membuat peluang kejadian dalam populasi menjadi sama, ketika banyaknya kejadian tidak bervariasi banyak, digunakan algoritme gerombol yang mengeksploitasi sifat ini. Data kematian Lithuania pada tahun 2003-2004 digunakan untuk menduga risiko yang sebenarnya dan menunjukkan penggunaan pendekatan tersebut. Pada karya ilmiah ini penulis mempelajari tulisan dari Sakalauskas (2010) yang berjudul On the Empirical Bayesian Approach for the Poisson-Gaussian Model. Tujuan 1. Mempelajari dan menganalisis model kematian yang diakibatkan oleh pembunuhan dan bunuh diri di Lithuania pada tahun 2003-2004. 2. Mempelajari variasi geografis dari risiko kematian dalam upaya untuk menunjukkan bahwa suatu kejadian tertentu dapat disebabkan oleh faktor risiko yang memiliki struktur spasial. 2 TINJAUAN PUSTAKA Ruang Contoh, Kejadian dan Peluang Dalam suatu percobaan sering kali diperlukan pengulangan yang dilakukan dalam kondisi yang sama. Semua kemungkinan hasil yang akan muncul akan diketahui tetapi hasil pada percobaan selanjutnya tidak dapat diduga dengan tepat. Percobaan semacam ini disebut percobaan acak. Definisi 1 (Ruang contoh) Ruang contoh adalah himpunan semua hasil yang mungkin dari suatu percobaan acak dan dinotasikan dengan Ω (Grimmett & Stirzaker 1992). Definisi 2 (Kejadian) Kejadian adalah suatu himpunan bagian dari ruang contoh Ω (Grimmett & Stirzaker 1992). Definisi 3 (Medan- ) Medan- adalah suatu himpunan yang anggotanya terdiri atas himpunan bagian ruang contoh Ω, yang memenuhi syarat berikut: 1. 2. Jika , maka Ai i 1 3. Jika , maka Jika , maka medan- disebut medan Borel. Anggota medan Borel disebut himpunan Borel (Hogg et al. 2005). Definisi 4 (Kejadian saling lepas) Kejadian dan disebut saling lepas jika irisan dari keduanya adalah himpunan kosong (Grimmett & Stirzaker 1992). Definisi 5 (Ukuran peluang) Misalkan Ω adalah ruang contoh suatu percobaan dan adalah medan- pada Ω. Suatu fungsi yang memetakan unsur-unsur ke himpunan bilangan nyata , atau disebut ukuran peluang jika 1. taknegatif, yaitu untuk setiap 2. bersifat aditif takhingga, yaitu jika dengan ∑ maka ⋃ 3. bernorma satu, yaitu . Pasangan disebut ruang ukuran peluang atau ruang peluang (Hogg et al. 2005). Definisi 6 (Kejadian saling bebas) Kejadian dan dikatakan saling bebas jika: Secara umum, himpunan kejadian { } dikatakan saling bebas jika: 3 (⋂ ) ∏ untuk setiap himpunan bagian J dari I (Grimmett & Stirzaker 1992). Peubah Acak dan Fungsi Sebaran Definisi 7 (Peubah acak) Misalkan adalah medan- dari ruang contoh suatu fungsi dengan sifat bahwa { (Grimmett & Stirzaker 1992). Suatu peubah acak adalah } untuk setiap Peubah acak dinotasikan dengan huruf kapital, misalnya peubah acak dinotasikan dengan huruf kecil seperti memiliki fungsi sebaran. , sedangkan nilai . Setiap peubah acak Definisi 8 (Fungsi sebaran) Misalkan adalah suatu peubah acak dengan ruang contoh . Misalkan kejadian , maka peluang dari kejadian adalah: Fungsi disebut fungsi sebaran dari peubah acak (Hogg et al. 2005). Definisi 9 (Peubah acak diskret) Peubah acak dikatakan diskret jika semua himpunan nilai dari peubah acak tersebut merupakan himpunan tercacah (Grimmett & Stirzaker 1992). Definisi 10 (Fungsi massa peluang) Fungsi massa peluang dari peubah acak diskret yang diberikan oleh adalah fungsi (Hogg et al. 2005). Definisi 11 (Peubah acak kontinu) Peubah acak dikatakan kontinu jika fungsi sebarannya dapat ditulis sebagai ∫ untuk suatu fungsi yang dapat diintegralkan. Selanjutnya fungsi disebut fungsi kepekatan peluang bagi (Hogg et al. 2005). Definisi 12 (Peubah acak Poisson) Suatu peubah acak disebut peubah acak Poisson dengan parameter , fungsi massa peluangnya diberikan oleh untuk (Ross 2007). jika 4 Definisi 13 (Sebaran gamma) Peubah acak dengan fungsi kepekatan peluang jika { lainnya dikatakan memiliki sebaran gamma dengan parameter (Gahramani 2005). Definisi 14 (Sebaran normal) Suatu peubah acak disebut memiliki sebaran normal dengan nilai harapan dan ragam , ditulis menyebar , jika fungsi kepekatan peluangnya adalah √ { ( ) }, untuk (Hogg et al. 2005). Lema 1 (Jumlah peubah acak Poisson) Misalkan dan adalah peubah acak yang saling bebas dan memiliki sebaran Poisson dengan parameter berturut-turut dan , maka memiliki sebaran Poisson dengan parameter . Bukti dapat dilihat pada Taylor & Karlin (1984). Nilai Harapan dan Ragam Definisi 15 (Nilai harapan) 1. Jika adalah peubah acak diskret dengan fungsi massa peluang nilai harapan dari , dinotasikan dengan , adalah , maka ∑ asalkan jumlah di atas konvergen mutlak. 2. Jika adalah peubah acak kontinu dengan fungsi kepekatan peluang maka nilai harapan dari adalah , ∫ asalkan integral di atas konvergen mutlak (Hogg et al. 2005). Definisi 16 (Ragam) Misalkan adalah peubah acak diskret dengan fungsi massa peluang dan nilai harapan . Ragam dari , dinotasikan dengan atau , adalah ∑( ) (Hogg et al. 2005). Definisi 17 (Fungsi indikator) Misalkan adalah suatu kejadian. Fungsi indikator dari { } yang diberikan oleh adalah suatu fungsi 5 { jika jika (Grimmett & Stirzaker 1992). Kekonvergenan Peubah Acak Terdapat beberapa cara untuk menginterpretasikan pernyataan kekonvergenan barisan peubah acak. Definisi 18 (Konvergen dalam peluang) Misalkan adalah barisan peubah acak pada suatu ruang peluang . Barisan peubah acak dikatakan konvergen dalam peluang ke , | dinotasikan , jika untuk setiap berlaku | , untuk (Grimmett & Stirzaker 1992). Definisi 19 (Konvergen dalam sebaran) Misalkan adalah peubah acak pada suatu ruang peluang . Suatu barisan peubah acak dikatakan konvergen dalam sebaran ke peubah acak , ditulis , untuk jika untuk , untuk semua titik x di mana fungsi sebaran (Grimmett & Stirzaker 1992). adalah kontinu Statistik, Penduga dan Sifat-sifatnya Definisi 20 (Statistik) Statistik adalah suatu fungsi dari satu atau lebih peubah acak yang tidak bergantung pada satu atau beberapa parameter yang nilainya tidak diketahui (Hogg et al. 2005). Definisi 21 (Penduga) Misalkan adalah contoh acak. Suatu statistik yang digunakan untuk menduga fungsi parameter , disebut penduga bagi , dilambangkan dengan ̂ Bilamana nilai maka nilai disebut sebagai dugaan bagi (Hogg et al. 2005). Definisi 22 (Penduga takbias) 1. Suatu penduga yang nilai harapannya sama dengan parameter disebut penduga takbias bagi 2. Jika penduga takbias asimtotik bagi (Hogg et al. 2005). maka Definisi 23 (Penduga konsisten) Suatu penduga yang konvergen dalam peluang ke parameter penduga konsisten bagi (Hogg et al. 2005). yaitu disebut , disebut 6 Sebaran Prior dan Sebaran Posteriror Definisi 24 (Sebaran Prior) Suatu peubah acak dengan parameter memiliki fungsi kepekatan peluang bersyarat yang dinotasikan dengan | dan adalah fungsi kepekatan marjinal dari , dinamakan sebaran prior (Arnold 1990). Definisi 25 (Sebaran Posterior) Suatu peubah acak merupakan sebaran prior dengan fungsi kepekatan peluang bersyarat | dan memiliki fungsi kepekatan peluang , maka fungsi kepekatan peluang bersama dari dinotasikan dengan | , dinamakan sebaran posterior, dinyatakan dengan | | | ∫ (Arnold 1990). Proses Stokastik Definisi 26 (Proses stokastik) { Proses stokastik memetakan suatu ruang contoh } adalah suatu himpunan dari peubah acak yang ke suatu ruang state (Ross 2007). Jadi untuk setiap pada himpunan indeks adalah suatu peubah acak. Indeks sering diinterpretasikan sebagai waktu dan sebagai state (keadaan) dari proses pada waktu Definisi 27 (Proses stokastik waktu kontinu) Suatu proses stokastik disebut proses stokastik dengan waktu kontinu jika berupa suatu interval (Ross 2007). Definisi 28 (Inkremen bebas) Suatu proses stokastik dengan waktu kontinu { } disebut memiliki inkremen bebas jika untuk semua peubah acak adalah bebas (Ross 2007). Dengan kata lain, suatu proses stokastik dengan waktu kontinu disebut memiliki inkremen bebas jika proses berubahnya nilai pada interval waktu yang tidak tumpang tindih (tidak overlap) adalah bebas. Definisi 29 (Inkremen stasioner) Suatu proses stokastik dengan waktu kontinu { } disebut memiliki inkremen stasioner jika memiliki sebaran yang sama untuk semua nilai (Ross 2007). Dengan kata lain, suatu proses stokastik dengan waktu kontinu disebut memiliki inkremen stasioner jika sebaran dari perubahan nilai antara sembarang dua titik hanya tergantung pada jarak antara kedua titik tersebut dan tidak bergantung pada lokasi titik-titik tersebut. 7 Proses Poisson Salah satu bentuk khusus dari proses stokastik dengan waktu kontinu adalah proses Poisson. Pada tulisan ini dianggap bahwa himpunan indeks adalah interval bilangan real taknegatif yaitu Definisi 30 (Proses pencacahan) } disebut proses pencacahan jika Suatu proses stokastik { menyatakan banyaknya kejadian yang telah terjadi sampai waktu Dari definisi tersebut, maka suatu proses pencacahan harus memenuhi syarat-syarat berikut: 1. untuk semua 2. Nilai adalah bilangan bulat. 3. Jika maka untuk 4. Untuk maka sama dengan banyaknya kejadian yang terjadi pada interval (Ross 2007) Definisi 31 (Proses Poisson) } disebut proses Poisson dengan laju , Suatu proses pencacahan { jika dipenuhi tiga syarat berikut: 1. . 2. Proses tersebut memiliki inkremen bebas. 3. Banyaknya kejadian pada sembarang interval waktu dengan panjang memiliki sebaran Poisson dengan nilai harapan Jadi untuk setiap , dengan (Ross 2007). Dari syarat (3) dapat dilihat bahwa proses Poisson memiliki inkremen stasioner. Dari syarat (3) juga dapat diperoleh ( ) Proses Poisson dengan laju yang merupakan konstanta untuk semua waktu disebut proses Poisson homogen. Jika laju bukan konstanta, tetapi merupakan fungsi dari waktu , maka proses tersebut disebut proses Poisson takhomogen. Untuk kasus ini, disebut fungsi intensitas dari proses Poisson tersebut. Fungsi intensitas harus memenuhi syarat untuk semua Misalkan adalah proses Poisson dan adalah suatu interval bilangan nyata. Jika adalah proses Poisson homogen, maka | | dengan | | adalah panjang interval , sedangkan menyatakan banyaknya kejadian dari proses Poisson pada interval Jika adalah proses Poisson takhomogen dengan fungsi intensitas ∫ , maka 8 Dengan kata lain, jika sifat: adalah proses Poisson takhomogen, maka memiliki 1. untuk setiap interval dengan 2. Untuk setiap bilangan bulat positif dan yang saling lepas dengan ( ) merupakan peubah acak yang saling bebas. adalah interval Metode Maximum Likelihood (ML) Defenisi 32 (Fungsi likelihood) Misalkan adalah barisan peubah acak independent and identically distributied (i.i.d) dengan fungsi kepekatan peluang , dengan diasumsikan skalar dan tidak diketahui, maka fungsi likelihood dapat dituliskan sebagai berikut: ∏ dengan (Hogg et al. 2005). Definisi 33 (Pendugaan maximum likelihood) ∏ Misalkan adalah fungsi likelihood, maka fungsi log dari , dapat dinotasikan dengan: ∑ Pendugaan parameter dengan metode maximum likelihood dapat diperoleh dengan menentukan nilai yang memaksimumkan fungsi atau (Hogg et al. 2005). 9 HASIL DAN PEMBAHASAN Model Gauss-Poisson ( ) dari Misalkan suatu himpunan populasi, di mana setiap populasi terdiri atas individu. Asumsikan beberapa kejadian (misalnya kematian yang diakibatkan oleh beberapa kasus bunuh diri) dapat terjadi pada populasi amatan. Tujuan dari tulisan ini adalah untuk menduga peluang kejadian yang tidak diketahui, ketika banyaknya kejadian dalam populasi yang diamati, . Karena risiko relatif tidak dapat digunakan dalam banyak kasus akibat perbedaan yang besar dalam ukuran populasi , maka pendekatan Bayes empiris diterapkan. Banyaknya kejadian diasumsikan mengikuti sebaran Poisson dengan parameter , yaitu: ( ) ( ) ( ) Asumsi ini sering dibenarkan (Bradley et al. 2000; Tsutakava et al. 1985; Clayton dan Kaldor 1987). Metode Bayes empiris adalah prosedur dua tahap, bergantung pada sebaran prior yang diperkenalkan pada tahap kedua (Bradley et al. 2000). Hal yang menarik pada model adalah logit menyebar normal dengan parameter . Dengan demikian, fungsi kepekatan peluang dari logit pada persamaan (2) adalah: ( ) ( ) ( ) Kemudian tingkat yang diberikan √ dievaluasi sebagai suatu nilai harapan posterior untuk ) ( ( ∫ ( ) ) di mana ( ) ∫ ( ) ( ) adalah peluang posterior dari banyaknya kejadian pada populasi ke- , . Analisis Bayes dalam statistik sering berhubungan dengan peminimuman fungsi tertentu, dinyatakan sebagai integral dari fungsi kepekatan posterior. Dengan demikian, dalam pendekatan Bayes empris dengan parameter yang tidak diketahui diduga dengan metode maximum likelihood. Fungsi logaritma likelihood, setelah beberapa manipulasi didapatkan sebagai berikut 10 ( ) ∑ ( ( ∑ (∫ )) ) ( ( ) ) yang harus diminimumkan untuk mendapatkan dugaan bagi parameter . Turunan dari Fungsi Likelihood dan Persamaan Titik Tetap Fungsi likelihood pada persamaan (6) dapat diturunkan terhadap parameter dan turunan pertama masing-masing fungsi ini adalah sebagai berikut: ( ) [ ∑ ∑* ∑[ ∑ ∫ ) ) ( ) ( ))] ( ( ( ∫ ( ( ( ( ( ) ( ) ) ( ) √ ) ( ( ∑[ ) ( [ ∑ ( ) ( ) ∫ ∑* ))+ ) ] ( ) ) ] ) ( ∑ ( ( ( ) ))] ( ( ∫ ) ( ))+ ) ( 11 ∑[ ( ∫ ) ( )( √ ∑ ( ( ∫ ( ( ) ) √ ) ( ) ) ) ( ) ( ( ( ( ) ) ] ) ) Dengan menyamakan persamaan (7) dan (8) dengan nol, yaitu ( ) ( ) maka diperoleh persamaan titik tetap untuk penduga ML dari berikut: ( ) ∑ [∑ ∑ ∫ ∫ ( ) ( ( ( ( ( ∫ ) ( ( ( ) ) ( ( ) ) ∑ ) ( ( ( ) ) ( ) ( ∑ ) ( ] ) ) ) ( ∫ ∑ ∫ ) ( ) ( ∫ ∑ ( ) ( ( ) ( ) ( ∫ ) ∫ ∑ ∑ ∑ ) ( sebagai ) ) ) ( ∑ ) ( ( ∫ dan ) ) ) ) 12 ( ∑ ∑ ( ) ( ) ( ) ∑ ) ( ( ∑ ) ( ) ( ( ∫ ( ( ∫ ) ) ) ∑ ∑ ∑ ) ) ( ( ( ) ) ) ( ( ) ( ) ) ) ( ( ) ) ) ( ( ) ) ( ( ∫ ( ∫ ( ) ∫ ( ∫ ( ) ) ) Namun, solusi dari persamaan ini hanya ada di bawah asumsi nonsingularitas dari penduga ML untuk (yaitu, ). Setelah beberapa analisis tentang persamaan (6), (7), (8), sampailah pada teorema berikut. Teorema 1 Solusi dari persamaan (11) dan (12) ada jika ∑( ) ∑ Bukti dapat dilihat pada Lampiran 1. Jika persamaan (13) tidak terpenuhi, penduga ML adalah: di mana ∑ ∑ Ini mengikuti dari kondisi persamaan (13) bahwa singularitas terjadi paling sering pada populasi kecil. Oleh karena itu, kondisi ini dapat digunakan untuk membuat populasi diatur dengan kejadian langka. Sangat mudah untuk memastikan bahwa dalam kasus singularitas ( ) banyak kejadian tetap untuk semua populasi, Nilai yang bersesuaian fungsi likelihood adalah: ( ) ∑( ( )) ∑ ( ( )) 13 Pendugaan Parameter Gauss dengan Metode “Iterasi Sederhana” Studi empiris dari fungsi likelihood dengan berbagai koleksi ukuran populasi dan banyaknya kasus dalam populasi memungkinkan untuk disimpulkan bahwa fungsi ini unimodal dan memiliki satu titik minimum. Dengan demikian, kondisi nonsingularitas pada persamaan (13) adalah benar. Kemudian solusi persamaan (9), (10) atau (11), (12) dapat ditentukan dengan metode numerik. Misalnya, metode “iterasi sederhana” (Kantorovich dan Akilov 1982) berguna untuk menyelesaikan persamaan-persamaan tersebut sehingga diperoleh penduga ML dari dan , ∑ ∑ Titik awal ( ) ( ( ∫ ( ∫ ( ) ) ) ) ( ( ( ) ) ) dari persamaan (18) dan (19) dapat dipilih ∑ ∑( ) dengan Pendugaan ML untuk dapat juga ditentukan dengan Metode Matriks Variabel (Dennis dan Schnabel 1996), dengan menggunakan titik awal pada persamaan (20) dan (21) serta menggunakan persamaan (7) dan (8) untuk memperkirakan gradien fungsi likelihood. Perhatikan bahwa integral dalam persamaan (5), (6), (7), (8), (11), (12), (18), dan (19) dapat dihitung dengan menggunakan, misalnya, formula kuadratur Hermite-Gauss (Abramovich dan Stegun 1968). Selain itu, pengintegralan dan peminimuman fungsi ML dapat dilakukan dengan menggunakan alat yang tepat dalam perangkat lunak matematika. Aplikasi untuk Penggerombolan Pendekatan Bayes empiris telah diterapkan untuk memetakan penggeromboralan (Knorr-Held dan Rasser (1999), Bradley et al. (2000)). Sifat model Gauss-Poisson untuk menangani populasi dengan rasio relatif tertutup satu sama lain dan memiliki peluang kejadian yang sama dapat diterapkan untuk 14 memetakan penggerombolan. Perhatikan sebuah himpunan gerombol yang terdiri atas himpunan populasi ( ). Perhatikan bahwa diperlukan sebagai gerombol himpunan bagian dari populasi yang bersebelahan (yaitu, setiap populasi di gerombol memiliki perbatasan bersama dengan beberapa penduduk lainnya dari gerombol ini), di mana kondisi ragam nol yang berasal dari persamaan (13) adalah benar: ∑( ) ( ) adalah himpunan gerombol yang mencakup Misalkan semua himpunan populasi , , Himpunan penggerombolan dipilih sehingga fungsi likelihood persamaan (6) menjadi minimum. Jadi, dengan menggunakan persamaan (17) setelah beberapa manipulasi sederhana dapat dipastikan bahwa himpunan penggerombolan terbaik harus menghasilkan fungsi minimum ∑ ( ) ∑ ∑ ( ) ∑ Peluang kejadian yang bersesuaian dengan populasi pada suatu gerombol adalah ∑ ∑ Perhatikan bahwa banyaknya gerombol yang mungkin agak besar dan harus dilihat melalui banyaknya gerombol yang besar, ketika himpunan penggerombolan dibentuk sehubungan dengan persamaan (23). Penyederhanaan heuristik dapat diterapkan dengan menggunakan proposisi berikut. Proposisi 1 Misalkan , dan ukuran , ( dan adalah dua populasi dengan banyaknya kejadian , maka ) ( ) ( ) ( ) Bukti dari proposisi ini diperoleh dengan manipulasi dasar. Dengan demikian dari persamaan (25), penggabungan dua gerombol menyebabkan fungsi likelihood menurun. Sifat ini dapat digunakan untuk penentuan himpunan penggerombolan terbaik. Dengan memulai dari himpunan penggerombolan awal, yang terdiri atas gerombol yang masing-masing hanya memiliki satu populasi, dua gerombol digabung jika kondisi pada persamaan (22) tetap berlaku dalam gerombol yang digabung dan penurunan fungsi likelihood minimum di antara semua kombinasi penggabungan yang mungkin, dan prosedur ini diulang sampai berakhir. Implementasi untuk Analisis Data Metode yang dikembangkan diterapkan untuk analisis data kematian yang diakibatkan oleh pembunuhan dan bunuh diri di Lithuania pada tahun 2003-2004 (semua kejadian dalam populasi, untuk pria dan wanita). Pengintegralan dan peminimuman fungsi likelihood dilakukan dengan menggunakan perangkat lunak matematika. 15 Hasil analisis kondisi nonsingularitas persamaan (13) dan pendugaan Bayes empiris dari peluang kejadian diberikan pada Tabel 1 dan Tabel 2. Tabel 1 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan di Lithuania, 2003 ∑ Semua bunuh diri Semua pembunuhan Pria bunuh diri Pembunuhan Pria Wanita bunuh diri Pembunuhan wanita 41.656 9.44 74.582 14.431 13.952 5.45 ( ) ⁄ ∑ 14255.1/1434=9.941 453.3/325=1.395 9484.2/1199=7.910 356.0/232=1.543 692.9/256=2.705 76.8/100=0.768 -7.652 -9.260 -7.7074 -8.840 -8.826 -9.817 0.281 0.136 0.288 0.159 0.371 0 Tabel 2 Pendugaan Bayes empiris dari kematian akibat bunuh diri/pembunuhan di Lithuania, 2004 ∑ Semua bunuh diri Semua pembunuhan Pria bunuh diri Pembunuhan Pria Wanita bunuh diri Pembunuhan wanita 40.334 8.587 70.337 12.515 14.075 5.093 ( ) ⁄ ∑ 15421/1381=11.166 287/294=0.976 11889/1124=10.577 313/2001=1.565 1573.2/257=6.121 84.1/93=0.904 -7.652 -9.260 -7.7074 -8.840 -8.826 -9.817 0.281 0 0.305 0.234 0.257 0 Pada Tabel 1 dan 2 jika Teorema 1 terpenuhi maka dilanjutkan dengan iterasi sederhana untuk mendapatkan dan setelah itu disubstitusi ke persamaan (4). Apabila Teorema 1 tidak terpenuhi maka digunakan pesamaan (14) dan (15). Dengan demikian, singularitas dalam sebaran prior, yaitu ragam prior nol diamati untuk beberapa kejadian langka (pembunuhan wanita pada tahun 20032004, dan semua pembunuhan pada tahun 2004). RR untuk kasus bunuh diri dan peluang kejadian diduga dengan metode Bayes empiris maupun dengan pendekatan penggerombolan disajikan pada Lampiran 2. Dengan demikian, dapat dilihat penurunan ragam penduga Bayes empiris dibandingkan dengan RR. 16 Tabel 3 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun 2003 untuk wilayah Shilutes d, Shirvintu d, Kaunas, dan Kauno d Wilayah Penduduk Pria ( ) Shilutes d Shirvintu d Kaunas Kauno d 26257 9392 167308 39525 Banyaknya RR Bunuh diri Bunuh diri ( ) ( ) 22 83.79 10 106.47 85 50.80 18 45.54 Bayes empiris Bunuh diri ( ) 84.506 94.815 54.077 57.698 Penggerombolan Bayes empiris Bunuh diri 84.406 84.406 56.682 56.682 Perbandingan peluang kejadian dengan menggunakan RR antara Shilutes d dan Shirvintu d cukup besar, sedangkan dengan menggunakan Bayes empiris perbandingannya lebih kecil. Begitu juga dengan wilayah Kaunas dan kauno d perbandingan peluang kejadian dengan menggunakan bayes empiris lebih kecil dibandingkan dengan menggunakan RR, sehingga pada tulisan ini digunakan penduga Bayes empiris untuk menentukan peluang kejadian. Peluang kejadian dengan menggunakan RR pada wilayah Kaunas lebih besar dibandingkan Kauno d, sedangkan dengan menggunakan Bayes empiris wilayah Kaunas lebih kecil dibandingkan dengan Kauno d. SIMPULAN Masalah yang dimodelkan adalah kematian yang diakibatkan oleh pembunuhan dan bunuh diri. Model ini diharapkan dapat membantu pihak yang berkepentingan, seperti petugas kepolisian. Tingkat kriminalitas ini biasanya berbeda-beda untuk setiap wilayah, sehingga dibutuhkan kebijakan yang tepat dalam menanganinya. Jika keragaman ukuran populasi tidak diperhitungkan, maka pendugaan risiko relatif dapat digunakan. Namun, karena risiko relatif tidak dapat digunakan dalam banyak kasus akibat perbedaan yang besar dalam ukuran populasi, maka pendekatan Bayes empiris diterapkan. Studi empiris dari fungsi likelihood dengan berbagai koleksi ukuran populasi dan banyaknya kasus dalam populasi memungkinkan untuk fungsi ini memiliki satu titik tetap. Perbandingan peluang kejadian dua wilayah dengan menggunakan RR lebih besar dibandingkan dengan menggunakan Bayes empiris. DAFTAR PUSTAKA Abramovich M, Stegun IA. 1968. Handbook of Mathematical Functions. New York (US): Dover. Arnold SF. 1990. Mathematical Statistics. New Jersey (US): Prentice Hall, Inc. 17 Bradley PC, Thomas AL, Bradley C. 2000. Bayes and empirical Bayes methods for data analysis. Springer. 7(2):153-154. doi: 10.1023/A:1018577817064. Clayton D, Kaldor J. 1987. Empirical Bayes estimates of age-standardized relative risks for use in disease mapping. Biometrics. 43(3):671-681. Dennis JE, Schnabel RB. 1996. Numerical Methods for Unconstrained Optimization and Nonlinear Equations (Classics in for Applied Mathematics). Philadelphia (US): SIAM. Gahramani S. 2005. Fundamentals of Probability with Stochastic Processes. Ed ke-3. New Jersey (US): Pearson Prentice Hall. Grimmett GR, Stirzaker DR. 1992. Probability and Random Processes. Ed ke-2. Oxford (UK): Clarendon Press. Hogg RV, Craig AT, McKean JW. 2005. Introduction to Mathematical Statistics. Ed ke-6. New Jersey (US): Prentice Hall. Kantorovich LV, Akilov GP. 1982. Functional Analysis. Oxford (UK): Pergamon Press. Knorr-Held L, Rasser G. 1999. Bayesian Detection of Clusters and Discontinuities in Disease Maping. Munich (DE): Departement of Munich. University of Munich. Ross SM. 2007. Introduction to Probability Models. Ed ke-9. Orlando, Florida (US): Academic Press. Sakalauskas L. 1995. On Bayes analysis of small rates in medicine. Proc. of the Intern. Conf. “Computer Data Analysis and Modeling”. 1:127-130. Minsk (BLR): Belarusia State University. Sakalauskas L. 2010. On the empirical Bayesian approach for the PoissonGaussian model. Springer Science. 12:247-259. doi: 10.1007/s11009-0099146-2. Taylor HM, Karlin. 1984. An Introduction to Stochastics Modelling. Orlando, Florida (US): Academic Press Inc. Tsutakava RK, Shoop GL, Marienfield CJ. 1985. Empirical Bayes estimation of cancer mortality rates. Stat. Med. 4:201-212. doi:10.1002/sim.4780040210. 18 Lampiran 1 Bukti Teorema 1 Misalkan: ( ) ( ) ( (1A) ( ) ( )) ( ) ( (2A) ) Untuk memastikan bahwa ( * ( ) ( ( ) ( * ( (3A) * ( ) * ( ( * ) ( ( ) * ( ( ) (( ⏟ ) *( ( *+ ( ) ⏟ ( ( ) ) ( ( ) ( ) ( ( ) ( (( (( ) ( ( ) *( ( maka diperoleh persamaan (4A) * * *( ( )) + ( ( )) ) ( ( ) ( * ( ) * ( ) ) * (4A) * * ( ) ( ( ) ( * ) ( * 19 Perhatikan bahwa ( ) ( ) (5A) Sekarang, dengan menggunakan ekspansi Taylor dari fungsi (1) dan mempertimbangkan (5A), kita memperoleh limit derivatif (7) dari fungsi likelihood sehubungan dengan saat mendekati nol: ( ) ∑ ∑ ( ∫ ( ) ( )) ( ( ( ) ∑ ( ) ( ) ( ∫ )* ( * ( ) ) ∑( * (6A) Jadi berdasarkan (6A) dan persamaan (8), kita mendapatkan penduga maximum likelihood: ∑ (7A) ∑ Analog, mari kita menghitung limit derivatif (8) dari fungsi likelihood sehubungan dengan , saat mendekati nol: ( ) ( ( ∑ ( ∫ ( ∑ ( ) ) ∑ ) ( ( ( ∫ ∑ ( )* [( ) ( )* ( ( [( ) ] ) + ] ) ] (8A) Solusi taknol dari persamaan (9) ada hanya jika Dengan menyubtitusi (7A) ke (8A) diperoleh pertaksamaan ∑ * ( ) ( ) ( )) [( , ( ) ( ∑ ) ) ( ) )( ( ∑ *( ) ( ) . + (9A) yang menyebabkan kondisi (13). 20 Lampiran 2 Hasil Analisis Berdasarkan Data Pria Bunuh Diri di Lithuania Tahun 2003 Wilayah (j) Akmenes d (1) Alytaus d (2) Alytus (3) Anykshchiu d (4) Birshtono m (5) Birzu d (6) Shakiu d (7) Shalchininku d (8) Shiauliai (9) Shiauliu d (10) Shilales d (11) Shilutes d (12) Shirvintu d (13) Druskininku m (14) Shvenchioniu d (15) Elektrenu d (16) Ignalinos d (17) Jonavos d (18) Jonishkio d (19) Jurbarko d (20) Kaishiadoriu d (21) Kalvariju d (22) Kaunas (23) Kauno d (24) Kazlu Ruda d (25) Kedainiu d (26) Kelmes d (27) Klaipeda (28) Klaipedos d (29) Kretingos d (30) Kupishkio d (31) Lazdiju d (32) Marijampoles m (33) Mazeikiu d (34) Moletu d (35) Neringa (36) Pagegiu d (37) Pakruojo d (38) Palanga (39) Panevezio r (40) Panevezys (41) Penduduk pria ( ) Banyaknya Bunuh diri ( ) RR Bunuh diri ( ) Bayes empiris Bunuh diri ( ) Penggerombolan Bayes empiris Bunuh diri 13920 15741 34085 16099 2467 16462 18271 18534 60221 24563 15183 26257 9392 11543 15174 13644 10578 24587 14815 17627 18366 6556 167308 39525 7037 30590 19334 88308 22598 21776 11366 12788 33536 31594 11899 1212 5770 13855 8062 20587 53913 10 12 17 19 4 12 17 15 43 20 15 22 10 8 7 17 14 16 15 20 13 9 85 18 2 31 20 45 17 26 11 14 30 37 15 1 10 11 8 24 26 71.84 76.23 49.88 118.02 162.14 72.90 93.04 80.93 71.40 81.42 98.79 83.79 106.47 69.31 46.13 124.60 132.35 65.08 101.25 113.46 70.78 137.28 50.80 45.54 28.42 101.34 103.44 50.96 75.23 119.40 96.78 109.48 89.46 117.11 126.06 82.51 173.31 79.39 99.23 116.58 48.23 79.315 81.059 61.649 103.871 99.451 79.199 90.054 83.200 74.207 83.074 92.867 84.506 94.815 78.976 66.782 106.126 107.419 73.091 94.103 101.846 77.664 103.989 54.077 57.698 68.865 96.571 96.325 56.582 79.467 107.071 91.168 97.725 88.329 108.116 105.566 87.421 114.788 82.951 91.415 104.829 57.253 99.883 89.358 89.358 99.883 89.358 84.406 56.682 89.358 84.406 84.406 84.406 84.406 84.406 89.358 45.896 89.358 74.285 56.682 84.406 84.406 89.358 89.358 56.682 56.682 56.682 84.406 84.406 84.406 84.406 113.549 99.883 89.358 89.358 84.406 84.406 84.406 84.406 84.406 84.406 84.406 84.406 21 Pasvalio d (42) Plunges d (43) Prienu d (44) Radvilishkio d (45) Raseiniu d (46) Rietavo d (47) Rokishkio d (48) Skuodo d (49) Taurages d (50) Telshiu d (51) Traku d (52) Ukmerges d (53) Utenos d (54) Varenos d (55) Vilkavishkio d (56) Vilniaus d (57) Vilnius (58) Visagino m (59) Zarasu d (60) 16365 20967 16714 24469 20562 5044 19442 12099 24604 26855 17400 22335 23205 14611 23786 43452 246412 13653 10498 13 18 15 25 21 13 21 11 19 22 14 23 29 25 21 23 110 4 6 79.44 85.85 89.75 102.17 102.13 257.73 108.01 90.92 77.22 81.92 80.46 102.98 124.97 171.10 88.29 52.93 44.64 29.30 57.15 82.622 85.912 88.126 96.396 95.754 141.063 99.126 88.538 80.459 83.280 83.048 96.589 111.323 134.156 87.398 61.963 47.495 60.778 74.574 84.406 113.549 89.358 84.406 84.406 113.549 84.406 113.549 84.406 84.406 89.358 84.406 99.883 89.358 56.682 45.896 45.896 74.285 99.883 22 RIWAYAT HIDUP Penulis dilahirkan di Bunga Tanjung Kabupaten Tanah Datar pada tanggal 31 Desember 1989. Anak dari pasangan Mawardi dan Warnida merupakan anak ketujuh dari tujuh bersaudara. Penulis menyelesaikan pendidikan Sekolah Dasar di SDN 15 Bunga Tanjung Kabupaten Tanah Datar pada tahun 2002, Sekolah Menengah Pertama di MTsN Pitalah Kabupaten Tanah Datar pada tahun 2005, Sekolah Menengah Atas di MAN Sumpur Kabupaten Tanah Datar pada tahun 2008, dan pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB dan diterima di Departemen Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama perkuliahan, penulis juga aktif di beberapa organisasi kampus, yaitu Gugus Mahasiswa Matematika (GUMATIKA) pada tahun 2009-2010, penulis aktif sebagai anggota Badan Pengawas Gumatika (BPG).