 
                                ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA BUMI
MENGGUNAKAN POISSON HIDDEN MARKOV MODELS DAN
ALGORITMA EM
(Studi Kasus Banyaknya Gempa Bumi di Wilayah Sumatra Barat
sampai Nusa Tenggara Timur)
ROSYID SURYANDARU
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2015 M/1436 H
ESTIMASI MODEL TERBAIK BANYAKNYA GEMPA
BUMI MENGGUNAKAN POISSON HIDDEN MARKOV
MODELS DAN ALGORITMA EM
(Studi Kasus Banyaknya Gempa Bumi di Wilayah Sumatra Barat sampai Nusa
Tenggara Timur)
Skripsi
Sebagai Salah Satu Syarat Untuk Memperoleh
Gelar Sarjana Sains
Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh:
Rosyid Suryandaru
108094000024
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2015/1436 H
i
PENGESAHAN UJIAN
Skripsi berjudul “Estimasi Model Terbaik Banyaknya Gempa Menggunakan
Poisson Hidden Markov Models dan Algoritma EM” yang ditulis oleh Rosyid
Suryandaru, NIM 108094000024 telah diuji dan dinyatakan lulus dalam sidang
Munaqosah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif
Hidayatullah Jakarta pada hari Kamis, 8 Januari 2015. Skripsi ini telah diterima
untuk memenuhi salah satu persyaratan dalam memperoleh gelar Sarjana strata satu
(S1) Program Matematika.
Menyetujui:
Penguji 1,
Penguji 2,
Dr. Nina Fitriyati, M.Kom
NIP. 19760414 200604 2 001
Irma Fauziah, M.Sc
NIP. 19800703 201101 2 005
Pembimbing 1,
Pembimbing 2,
Suma’inna, M.Si
NIP. 19791208 200701 2 015
Mahmudi, M.Si
Mengetahui,
Dekan Fakultas Sains dan Teknologi,
Ketua Program Studi Matematika,
Dr. Agus Salim, M.Si
NIP. 19720816 199903 1 003
Yanne Irene, M.Si
NIP. 19741231 200501 2 018
ii
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENARBENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN
SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI
ATAU LEMBAGA MANAPUN.
Jakarta, 8 Januari 2015
Rosyid Suryandaru
108094000024
iii
PERSEMBAHAN
Alhamdulillahirobbil’alamin, segala puji bagi Allah, Tuhan Semesta Alam
Skripsi ini saya persembahkan untuk Ibuku tercinta Sri Kus Indrati, Kakakkakakku, Pilon dan seluru keluarga besarku, dan juga Keluarga besar Prodi
Matematika, serta semua pihak yang terlibat di dalamnya.
Semoga selalu diridhoi Allah SWT, selalu dalam lindungan-Nya, serta selalu
dibukakan pintu rahmat, kasih sayang, dan hidayah-Nya
Amin
MOTTO
A good student never will forget a good teacher :’)
Lebih baik salah karena melakukan sesuatu dari pada tidak pernah
salah karena tidak pernah melakukan sesuatu
iv
ABSTRAK
Rosyid Suryandaru, Estimasi Model Terbaik Banyaknya Gempa Bumi
Menggunakan Algoritma EM dan Poisson Hidden Markov Models. Di bawah
bimbingan Suma’inna, M.Si dan Mahmudi, M.Si.
Penelitian dilakukan dengan dilatarbelakangi oleh wilayah Indonesia yang
merupakan salah satu wilayah yang rawan akan gempa bumi. Secara umum,
banyaknya peristiwa gempa bumi memiliki karakteristik distribusi Poisson. Akan
tetapi terjadi overdispersi relatif terhadap distribusi poisson. Salah satu cara dalam
mengatasi overdispersi khususnya pada distribusi poisson adalah dengan
menggunakan Poisson Hidden Markov Models (PHMMs), yang kemudian
mengaplikasikan algoritma EM (Expectation Maximisation Algorithm) pada
masing-masing model untuk memdapatkan parameter estimasinya. Dari modelmodel yang diperoleh, selanjutnya dipilih model terbaik berdasarkan nilai AIC
(Akaike Information Criterion) terkecil. Data yang digunakan adalah data
sekunder, yaitu data banyaknya gempa bumi di wilayah Sumatra Barat sampai
Nusa Tenggara Timur tahun 2008-2013 dengan magnitudo ≥5 Skala Richter yang
terjadi pada kedalaman gempa bumi dangkal yaitu ≤60 Km.
Dari penelitia yang dilakukan didapat 3 model PHMM, yaitu model dengan
keadaan tersembunyi, yaitu ๐ = (2,3,4). Berdasarkan nilai AIC, model dengan 3
keadaan tersembunyi merupakan model estimasi banyaknya gempa bumi terbaik
dengan nilai AIC sebesar 537,429. Hasil estimasi parameter dari model terbaik
PHMM, yaitu model dengan 3 keadaan tersembunyi, nilai estimasi parameter ratarata banyaknya gempa bumi yang terjadi sebanyak 2,8446121 ≈ 3 peristiwa dalam
kurun waktu 15 hari.
Kata kunci: Overdispersi, Mixture Distribution, Rantai Markov, Peluang
forward backward, PHMMs, algoritma EM, AIC.
v
ABSTRACT
Rosyid Suryandaru, The Best Model Estimation for Many Earthquake Happen
with Using EM Algorithm in Poisson Hidden Markov Models. Under guidance
Suma’inna, M.Si and Mahmudi, M.Si.
This research was conducted with Indonesian zone that one of zone have
often earthquake happen. In other hand, many earthquake happen have a
characteristic poisson of distribution. But often be relative overdisversion. One of
method to solve overdisversion on poisson distribution specifically is with using
Poisson Hidden Markov Models (PHMMs) that so applied EM algorithm
(Expectation Maxsimisation Algorithm) on every models to generated estimation
value. From every models resulted, next selecting the best model obtained from
the least AIC value (Akaike Information Criterion). In this thesis, using secondary
data, that is data of many earthquake happen in Sumatra Barat till Nusa Tenggara
Timur on 2008-2013 with magnitude ≥ 5 SR that happen in earthquake low
deepen is ≤ 60 km.
From this research exist 3 PHMM models, that is hidden model happen,
with m= (2,3,4). Obtained AIC value, 3 of hidden model happen is the best model
estimation of many earthquake happen with weight of AIC value is 537,429.
Estimation parameter result from the best model of PHMM is 3 of hidden happen
model, average of estimation parameter value in many earthquake happen is
2,8446121≈3 moment of 15 day.
Keywords: Overdisversion, Mixture Distribution, Markov Chain, Forward
Backward Probability, PHMMs, EM Algirithm, AIC.
vi
KATA PENGANTAR
โซุจุณู
 ูููุง ุงุงุฑ ุญู
ู ุงุงุฑ ุญูู
โฌ
Assalamu’alaikum Warahmatullahi Wabarakatuh
Alhamdulillah, Segala puji bagi Allah, Tuhan Semesta Alam, yang senantiasa
melimpahkan rahmat dan nikmat-Nya kepada kita semua, tak terkecuali pada penulis,
hingga penulis dapat menyelesaikan skripsi “Estimasi Model Terbaik Banyaknya
Gempa Bumi Menggunakan Poisson Hidden Markov Models dan Algoritma EM”
dengan studi kasus “Banyaknya Gempa Bumi di Wilayah Sumatra Barat sampai Nusa
Tenggara Timur”. Shalawat serta salam senantiasa tercurah kepada Nabi Muhammad
SAW, manusia luar biasa karena kecerdasannya, kemuliaan akhlaqnya, keluhuran
budi pekertinya, dan sunnah-sunnah Rasulullah yang tetap subur.
Dalam penyusunan skripsi ini, penulis banyak mendapat dorongan, semangat,
dan bimbingan serta kritikan dan sara dari berbagai pihak. Oleh karena itu, pada
kesempatan ini penulis ingin mengucapkan terima kasih kepada:
1. Orang tuaku (Bapak Surais, Ibu Sulasmi dan Ibu Sumariyati), Kakakku (Mas
Wahid) dan adikku (Zulfikar) tercinta serta seluruh keluarga besar penulis yang
selalu memberikan kasih sayang dan selalu mendoakan penulis sehingga dapat
menyelesaikan skripsi ini,
2. Dr. Agus Salim, M.Si, selaku Dekan Fakultas Sains dan Teknologi Universitas
Islam Negeri Syarif Hidayatullah Jakarta,
vii
3. Ibu Yanne Irene, M.Si, selaku Ketua Program Studi Matematika Fakultas Sains
dan Teknologi UIN Syarif Hidayatullah Jakarta,
4. Ibu Suma’inna, M.Si, selaku Pembimbing I dan Mahmudi, M.Si, selaku
Pembimbing II. Mohon maaf atas semua kesalahan penulis selama ini, serta
terima kasih banyak atas waktu dan kesabarannya dalam membimbing penulis
dalam menyelesaikan penelitian ini,
5. Seluruh dosen dan karyawan Program Studi Matematika, yang telah mengajarkan
banyak hal yang sangat bermanfaat bagi penulis.
6. Saudara-saudaraku, Mas Karno, Wawan, Degleng, Bono, Mas Adi, dan temanteman KremboL,
7. Shilvia ♥, yang selalu sabar dan tidak pernah berhenti memberi semangat
penulis.
8. Sahabat-sahabat terbaikku selama mengenyam pendidikan di UIN Jakarta
khususnya Math’08, Putra, Deny, Munir, Tedy, Ucok Lah, Azmi, Rijak,
Nijaruddin, Sopyan Lampung, Ustad Luqman, dll,
9. Teman-teman Himatika UIN Jakarta.
10. Teman-teman Kosan Antalaklai (Mas Kiki dan Mbak Desi, Ka Ucal, bos Rengki,
Furqon, Kochar, Dolay, Ega, Angga, Mukmin, Cahyadi, Hanip, Mali, Yopy,
Azom, Zul, Onay, Awan) Bu Kosan Antalaklai, serta semua pihak yang telah
membantu penulis.
viii
Penulis menyadari bahwa masih banyak kelemahan dan kekurangan yang
terdapat pada skripsi ini. Atas dasar itulah penulis memohon maaf yang sebesarbesarnya kepada semua pihak jika terdapat kesalahan yang kurang berkenan. Namun,
saran dan kritik selalu penulis harapkan demi perbaikan pada penelitian selanjutnya.
Akhir kata, harapan yang besar bahwa skripsi ini dapat bemanfaat dan
memberikan kontribusi yang berarti, baik bagi penulis khususnya dan bagi pembaca
umumnya.
Wassalamu’alaikum Warahmatullahi Wabarakatuh
Jakarta, 8 Januari 2015
Penulis
ix
DAFTAR ISI
HALAMAN JUDUL ........................................................................................
i
PENGESAHAN UJIAN ...................................................................................
ii
PERNYATAAN ................................................................................................ iii
PERSEMBAHAN DAN MOTTO ................................................................... iv
ABSTRAK ........................................................................................................
v
ABSTRACT ...................................................................................................... vi
KATA PENGANTAR ...................................................................................... vii
DAFTAR ISI .....................................................................................................
x
DAFTAR TABEL ............................................................................................ xii
DAFTAR GAMBAR ........................................................................................ xiii
DAFTAR LAMPIRAN .................................................................................... xiv
BAB I PENDAHULUAN
1.1 Latar Belakang ..............................................................................
1
1.2 Rumusan Masalah .........................................................................
3
1.3 Batasan Masalah ...........................................................................
3
1.4 Tujuan Penelitian ..........................................................................
4
1.5 Manfaat Penelitian ........................................................................
4
BAB II LANDASAN TEORI
2.1 Peluang dan Variabel Acak ...........................................................
5
2.2 Distribusi Poisson .........................................................................
6
2.3 Independent Mixture Models ........................................................
9
2.4 Rantai Markov ............................................................................... 11
2.5 PHMMs (Poisson Hidden Markov Models) .................................. 17
2.6 Penskalaan Komputasi Likelihood ................................................ 22
x
2.7 Estimasi Algoritma EM (Expectaton Maximisation Algorithm)
pada HMM .................................................................................... 23
2.8 Pemilihan Model Berdasarkan AIC ............................................... 27
BAB III METODE PENELITIAN
3.1 Sumber Data .................................................................................. 29
3.2 Tahap Persiapan Data ................................................................... 30
3.3 Tahap Pemodelan ........................................................................... 30
3.4 Pemilihan Model Terbaik .............................................................. 34
3.5 Alur Peneliitian .............................................................................. 35
BAB IV PEMBAHASAN
4.1 Deskripsi Data ............................................................................... 36
4.2 Pengecekan Overdispersi Data ..................................................... 38
4.3 Pemodelan Banyaknya Gempa Bumi dengan PHMMs ................ 39
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan ................................................................................... 47
5.2 Saran ............................................................................................. 47
DAFTAR PUSTAKA ........................................................................................ 48
LAMPIRAN ....................................................................................................... 50
xi
DAFTAR TABEL
Tabel 2.1 Peluang Keadaan Cuaca ..................................................................... 15
Tabel 3.1 Data Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi Nusa
Tenggara Timur Tahun 2008-2013 .................................................... 29
Tabel 4.1 Data Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi Nusa
Tenggara Timur dengan Magnitudo ≥5 SK pada Kedalaman ≤60
Km Tahun 2008-2013 ...................................................................... 36
Tabel 4.2 Banyaknya Peristiwa Gempa Bumi di Propinsi Sumatra Barat
sampai Propinsi Nusa Tenggara Timur dengan Magnitudo ≥5
Skala Richter pada Kedalaman ≤60 Km Periode 15 Hari Tahun
2008-2013 ......................................................................................... 38
Tabel 4.3
Statistik Deskriptif Banyaknya Gempa Bumi di Propinsi Sumatra
Barat sampai Propinsi Nusa Tenggara Timur Periode 15 Hari
Tahun 2008-2013............................................................................... 39
Tabel 4.4 Hasil Perhitunggan Parameter ๐ dan Parameter ๐
 pada 2 Keadaan
Tersembunyi ...................................................................................... 41
Tabel 4.5 Peluang pada 2 Keadaan Tersembunyi .............................................. 42
Tabel 4.6 Parameter Input ๐, ๐
, dan ๐ช pada masing-masing PHMM .............. 43
Tabel 4.7 Parameter Estimasi Algoritma EM pada masing-masing PHMM ..... 45
xii
DAFTAR GAMBAR
Gambar 2.1
Matriks Peluang Transisi Satu Langkah berukuran ๐ × ๐ ......... 14
Gambar 2.2
Graf Dasar HMM ......................................................................... 18
Gambar 3.1
Alur Penelitian ............................................................................. 35
Gambar 4.1
Sebaran Data Gempa Bumi dengan Magnitudo ≥5 SK pada
Kedalaman ≤60 Km Tahun 2008-2013 ........................................ 37
Gambar 4.2
Peta Sebaran Gempa Bumi dengan Magnitudo ≥5 Skala Richter
pada Kedalaman ≤60 Km Tahun 2008-2013 ................................ 37
Gambar 4.3
Sebaran Banyaknya Peristiwa Gempa Bumi di Propinsi Sumatra
Barat sampai Propinsi Nusa Tenggara Timur dengan Magnitudo
≥5 Skala Richter pada Kedalaman ≤60 Km Periode 15 Hari
Tahun 2008-2013 .......................................................................... 39
Gambar 4.4a Hasil Pengelompokan Data Banyaknya Gempa Bumi pada 2
Keadaan Tersembunyi .................................................................. 43
Gambar 4.4b Hasil Pengelompokan Data Banyaknya Gempa Bumi pada 3
Keadaan Tersembunyi .................................................................. 44
Gambar 4.4c Hasil Pengelompokan Data Banyaknya Gempa Bumi pada 4
Keadaan Tersembunyi .................................................................. 44
xiii
DAFTAR LAMPIRAN
Lampiran 1. Data Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi Nusa
Tenggara Timur dengan Magnitudo ≥5 SK pada Kedalaman ≤60 Km
Tahun 2008-2013 ................................................................................ 50
Lampiran 2. Peta Sebaran Gempa Bumi .................................................................. 51
Lampiran 3. Banyaknya Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi
Nusa Tenggara Timur dengan Magnitudo ≥5 SK pada Kedalaman
≤60 Km Periode 15 Hari Tahun 2008-2013......................................... 52
Lampiran 4. Kode Komputasi Software R untuk Peluang Forward dan Peluang
Backward pada PHMM ........................................................................ 53
Lampiran 5. Kode Komputasi Software R untuk Estimasi EM pada PHMM .......... 54
Lampiran 6. Parameter Estimasi Algoritma EM untuk ๐ = 2................................. 55
Lampiran 7. Parameter Estimasi Algoritma EM untuk ๐ = 3................................. 56
Lampiran 8. Parameter Estimasi Algoritma EM untuk ๐ = 4................................. 57
xiv
BAB I
PENDAHULUAN
1.1 Latar Belakang
Indonesia merupakan negara kepulauan yang secara astronomis terletak di
60LU-110LS dan antara 950BT-1410 BT dan secara geografis teletak diantara dua
benua, yaitu Benua Asia dan Benua Australia, serta diantara dua samudera, yaitu
Samudera Hindia dan Samudera Pasifik. Dan secara geologis wilayah Indonesia
dilalui oleh dua jalur pegunungan muda dunia, yaitu Pegunungan Mediterania di
sebelah barat dan Pegunungan Sirkum Pasifik di sebelah timur, atau berada di
kawasan dengan sebutan "Pacific Ring of Fire", yaitu sebuah zona dimana banyak
memiliki gunung berapi yang aktif sehingga sering terjadi gempa bumi vulkanik.
Selain gempa bumi vulkanik, Indonesia juga rawan akan gempa bumi tektonik,
dikarenakan letak Indonesia berada pada pertemuan empat lempeng tektonik yaitu
lempeng Benua Asia, lempeng Benua Australia, lempeng Samudera Hindia, dan
lempeng Samudera Pasifik[10].
Sejumlah peristiwa bencana gempa bumi dengan magnitudo besar telah tejadi
10 tahun terakhir di sejumlah wilayah di Indonesia. Peristiwa gempa bumi tersebut
antara lain gempa bumi di Aceh pada tanggal 26 Desember 2004 yang
mengakibatkan terjadinya bencana tsunami, gempa bumi Nias pada tanggal 28 Maret
2005, gempa bumi di Yogyakarta pada tanggal 27 Mei 2006, di Pangandaran 17 Juli
1
2006, Tasikmalaya 2 September 2009 dan gempa bumi Padang Pariaman pada
tanggal 30 September 2009. Tidak kurang dari 177.701 orang meninggal dunia akibat
peristiwa tersebut[11].
Secara umum, karakteristik peristiwa banyaknya gempa bumi dalam periode
tertentu didekati oleh distribusi Poisson, dengan sifat khas yang dimiliki yaitu ratarata dan variansinya memiliki nilai yang sama. Akan tetapi, terkadang dalam
pengaplikasian distribusi Poisson, khususnya pada kasus kegempaan, terjadi
overdispersi relatif dikarenakan sifat tersebut tidak sepenuhnya terpenuhi, sehingga
mengakibatkan ketidaktepatan distribusi sebagai model. Terjadinya overdispersi pada
distribusi tertentu diduga disebabkan adanya beberapa pengelompokan data pada
distribusi tersebut, dengan masing-masing kelompok memiliki parameter yang
berbeda-beda. Salah satu metode untuk mengatasi masalah pengamatan overdispersi
adalah dengan mengunakan Mixture Model (model campuran)[5].
Hidden Markov Models (HMMs) adalah perluasan dari rantai Markov dimana
distribusi hasil pengamatannya bergantung pada keadaan proses Markov yang tidak
teramati (unobserved). Distribusi marginal dari HMMs merupakan distribusi
campuran. Pada kasus kegempaan, HMMs lebih dikenal dengan istilah PHMMs
(Poisson Hidden Markov Models). Dalam PHMMs, setiap observasinya dihasilkan
oleh salah satu dari ๐ keadaan tersembunyi (hidden state)[5]. PHMMs diaplikasikan
untuk mengidentifikasi pola-pola barisan keadaan yang tidak teramati yang
mendasari barisan observasi.
2
Pada penelitian ini, peneliti tertarik untuk membangun sebuah model
banyaknya gempa bumi menggunakan metode PHMMs serta mencari nilai estimator
parameternya dengan menggunakan Alogorima EM (Expectation Maximization
Algorithm). Wilayah penelitian yang diteliti adalah wilayah Propinsi Sumatra Barat
hingga Propinsi Nusa Tenggara Timur Indonesia.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah dikemukakan, rumusan masalah dalam
penulisan ini antara lain:
1. Bagaimana membangun model untuk mengestimasi banyaknya gempa bumi
menggunakan PHMMs?
2. Apakah model terbaik untuk mengestimasi banyaknya gempa bumi di wilayah
Propinsi Sumatra Barat hingga Propinsi Nusa Tenggara Timur menggunakan
metode PHMMs dengan Algoritma EM?
3. Bagaimana
hasil
estimasi
parameter
banyaknya
gempa
bumi
dengan
menggunakan metode PHMMs?
1.3 Batasan Masalah
Ruang lingkup pembahasan dalam skripsi ini hanya membahas banyaknya
peristiwa gempa bumi yang terjadi di wilayah Propinsi Sumatra Barat hingga
3
Propinsi Nusa Tenggara Timur dengan besar magnitudo gempa bumi ≥5 Skala
Richter pada kedalaman gempa dangkal yaitu ≤60 Km.
1.4 Tujuan Penulisan
Tujuan penelitian ini adalah:
1. Membangun model untuk mengestimasi banyaknya gempa bumi menggunakan
PHMMs,
2. Mencari model banyaknya gempa bumi terbaik untuk wilayah Propinsi Sumatra
Barat hingga Propinsi Nusa Tenggara Timur menggunakan metode PHMMs
dengan estimasi algoritma EM,
3. Mencari nilai estimasi parameter banyaknya gempa bumi dengan menggunakan
metode PHMMs.
1.5 Manfaat Penelitian
Manfaat penelitian ini diantaranya adalah:
1. Dapat diketahui nilai estimasi rata-rata banyaknya gempa bumi di wilayah
Propinsi Sumatra Barat hingga Propinsi Nusa Tenggara Timur.
2. Sebagai tambahan pengetahuan tentang PHMMs dan pengaplikasian Algoritma
EM untuk PHMMs.
3. Sebagai bahan referensi bagi peneliti lain yang ingin mengaplikasikan PHMMs
dan Algoritma EM untuk bidang yang lain.
4
BAB II
LANDASAN TEORI
2.1 Peluang dan Variabel Acak
A. Teori Peluang
Misalkan ๐ adalah ruang sampel dari suatu eksperimen acak dan ๐จ adalah
kumpulan semua titik sampel yang bisa dibentuk dari ๐. Peluang pada ๐ adalah
kumpulan semua fungsi ๐ dengan domain ๐ด ke daerah hasil [0,1] yang memenuhi
sifat sebagai berikut[1]:
1. 0 ≤ ๐(๐ด) ≤ 1, ∀๐ด ∈ ๐จ,
2. ๐ ∅ = 0,
3. ๐ ๐ = 1
Peluang terjadinya ๐ต bila diketahui bahwa suatu kejadian lain ๐ด telah terjadi
disebut dengan peluang bersyarat dan dilambangkan dengan ๐(๐ต|๐ด). Lambang
๐(๐ต|๐ด) dibaca “peluang terjadinya ๐ต bila ๐ด terjadi” atau lebih singkatnya lagi
“peluang ๐ต, bila ๐ด diketahui”. Jika ๐ด dan ๐ต adalah ๐, maka peluang bersyarat ๐ต bila
๐ด diketahui didefinisikan sebagai[1]:
๐ ๐ต๐ด =
๐(๐ด∩๐ต)
๐(๐ด)
, dengan ๐ ๐ด > 0
(2.1)
Jika kejadian ๐ด dan ๐ต keduanya dapat terjadi sekaligus, maka[1]:
๐ ๐ด ∩ ๐ต = ๐ ๐ด .๐ ๐ต ๐ด
5
(2.2)
Berdasarkan kaidah penggandaan umum, jika dalam suatu percobaan kejadiankejadian ๐ด1 , ๐ด2 , ๐ด3 , … dapat terjadi, maka[1]:
๐ ๐ด1 ∩ ๐ด2 ∩ ๐ด3 ∩ … ∩ ๐ด๐
= ๐ ๐ด ๐ ๐ด2 ๐ด1 ๐ ๐ด3 ๐ด1 ∩ ๐ด2 … ๐ ๐ด๐ ๐ด1 ∩ ๐ด2 ∩ … ∩ ๐ด๐−1
(2.3)
B. Variabel Acak
Misal ๐ธ adalah sebuah percobaan dangan ruang sampel ๐. Peubah acak atau
variabel acak didefinisikan sebagai sebuah fungsi ๐ yang memetakan setiap anggota
๐  ∈ ๐ dengan sebuah bilangan real ๐(๐ )[2].
Jika dalam ruang sampel mengandung titik sampel yang berhingga banyaknya
atau suatu deretan anggota yang banyaknya sama dengan banyaknya bilangan bulat
(terhitung), maka variabel acak yang didefinisikan pada ruang sampel tersebut adalah
variabel acak diskrit[2].
2.2 Distribusi Poisson
Percobaan yang menghasilkan nilai-nilai bagi suatu peubah acak ๐, dimana
banyaknya hasil percobaan terjadi selama selang waktu tertentu atau pada daerah
tertentu, disebut dengan percobaan Poisson[1]. Selang waktu yang dimaksud
misalkan: semenit, sehari, seminggu, sebulan, setahun, dan sebagainya. Sedangkan
daerah tertentu yang dimaksud misalkan: suatu luasan, volume, bagian bahan dan
sebagainya. Dalam contoh kasus misalkan:
a. Banyaknya dering telepon per jam di kantor,
6
b. banyaknya kecelakaan mobil per hari di jalan tol,
c. banyaknya nasabah yang mengantri di bank dalam waktu satu jam,
d. banyaknya tikus sawah per hektar,
e. banyaknya bakteri dalam satu tetes air,
f. banyaknya kesalahan ketik per halaman dan sebagainya.
Karakteristik percobaan Poisson adalah sebagai berikut[1]:
1. Banyaknya hasil percobaan yang terjadi dalam selang waktu atau daerah
tertentu, tidak bergantung pada banyaknya hasil percobaan yang terjadi pada
selang waktu atau daerah lain yang terpisah.
2. Peluang terjadinya suatu hasil percobaan selama selang waktu yang singkat
sekali atau dalam suatu daerah yang kecil, sebanding dengan panjang selang
waktu tersebut atau besarnya daerah tersebut, dan tidak bergantung pada
banyaknya hasil percobaan yang terjadi di luar selang waktu atau daerah
tersebut.
3. Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang
waktu yang singkat atau daerah yang kecil dapat diabaikan.
Bilangan ๐ yang menyatakan banyaknya hasil percobaan dalam suatu percobaan
Poisson disebut peubah acak Poisson, dan sebaran peluangnya disebut dengan
distribusi Poisson[1]. Distribusi Poisson pertama kali ditemukan oleh S.D. Poisson
(1781–1840), seorang ahli matematika berkebangsaan Perancis. Distribusi Poisson
7
disebut juga distribusi peristiwa yang jarang terjadi, dimana melibatkan jumlah
percobaan (๐) yang besar dengan peluang sukses (๐) sangat kecil[3].
Variabel acak ๐ dikatakan berdistribusi Poisson dengan parameter ๐ > 0,
dinotasikan ๐ ~ Poisson(๐), jika ๐ mempunyai fungsi massa peluang (PMF)[4]:
๐ −๐ ๐ ๐ฅ
๐ ๐ฅ =
, ๐ฅ = 0, 1, 2, …
๐ฅ!
0 ,
(2.4)
๐ฅ lainnya.
Persamaan (2.4) memenuhi syarat-syarat PMF dikarenakan[4]:
(i) ๐ ๐ฅ ≥ 0 karena ๐ > 0
(ii) Total peluangnya adalah 1 dikarenakan:
∞
๐ ๐ฅ =
๐ฅ
๐ฅ=0
๐ −๐ ๐๐ฅ
= ๐ −๐
๐ฅ!
∞
๐ฅ=0
๐๐ฅ
= ๐ −๐ ๐ ๐ = 1
๐ฅ!
Variable acak berdistribusi Poisson umumnya digunakan untuk menyatakan
banyaknya peristiwa yang terjadi dalam satu satuan waktu, misalnya banyaknya
kecelakaan mobil per hari di jalan tol selama bulan Oktober, banyaknya mobil yang
lewat selama 10 menit di suatu ruas jalan, banyaknya antrian nasabah bank dalam
waktu satu jam, dan sebagainya. Distribusi Poisson mempunyai Fungsi Pembangkit
Momen (MGF)[4]:
∞
๐ ๐ก =๐ธ ๐
๐ก๐ฅ
∞
๐ก๐ฅ
=
๐ ๐ก๐ฅ
๐ ๐ ๐ฅ =
๐ฅ=0
๐ฅ=0
∞
=๐
−๐
๐ฅ=0
๐ก
๐๐ฅ ๐ −๐
๐ฅ!
(๐๐ ๐ก )๐ฅ
๐ฅ!
= ๐ −๐ ๐ ๐๐ = ๐ ๐(๐
๐ก −1)
(2.5)
8
untuk setiap ๐ก ∈ โ. Karena
๐′ ๐ก = ๐ ๐(๐
๐ก −1)
๐๐ ๐ก
dan
๐′′ ๐ก = ๐ ๐(๐
๐ก −1)
๐๐ ๐ก + ๐ ๐(๐
๐ก −1)
๐๐ ๐ก
2
maka
๐ = ๐′ 0 = ๐
(2.6)
dan
๐ 2 = ๐′′ 0 − ๐ = ๐ + ๐2 − ๐2 = ๐
(2.7)
Hasil tersebut memperlihatkan bahwa pada distribusi Poisson mempunyai ciri khas
bahwa mean (๐) dan variansinya (๐ 2 ) memiliki nilai yang sama dengan parameternya
(๐).
2.3 Independent Mixture Models
Pada distribusi Poisson dengan fungsi massa peluang ๐ ๐ฅ = ๐ −๐ ๐๐ฅ /๐ฅ!
memiliki sifat khas bahwa nilai variansi sama dengan nilai mean (persamaan 2.6 dan
2.7). Akan tetapi ketika nilai variansi sampel (๐  2 ) lebih besar dari rata-rata sampelnya
(๐ฅ) maka akan mengakibatkan overdispersi relatif pada distribusi Poisson dan
ketidaktepatan distribusi sebagai model. Salah satu metode dalam mengatasi
pengamatan overdispersi yaitu dengan mengunakan Mixture Model (model
campuran)[5].
9
Mixture Models dirancang untuk mengakomodasi heterogenitas yang tidak
teramati (unobserved) pada populasi, dimana populasi dimungkinkan terdiri dari
kelompok-kelompok yang tidak teramati[5]. Sebagai contoh misalkan ๐ adalah
distribusi banyaknya bungkus rokok yang dibeli oleh pelanggan di supermarket. Para
pelanggan tersebut dapat dibagi menjadi beberapa kelompok, misalkan dibagi
menjadi dua kelompok yaitu perokok pasif dan perokok aktif.
Jika banyaknya
bungkus rokok yang dibeli oleh masing-masing kelompok pelanggan berdistribusi
Poisson, maka distribusi ๐ belum tentu berdistribusi Poisson dan memungkinkan
terjadinya overdispersi relatif pada distribusi tersebut. Anggaplah masing-masing
kelompok berdistibusi Poisson memiliki rata-rata ๐1 dengan peluang ๐ฟ1 dan ๐2
dengan peluang ๐ฟ2 = 1−๐ฟ1 , dimana dalam menentukan nilai rata-rata tersebut
didasarkan pada beberapa mekanisme acak lain yang disebut “proses parameter”. Jika
proses parameter dimana serangkaian variabel acaknya saling bebas (independent)
dan banyaknya juga saling bebas maka proses tersebut disebut “mixture independen”
(independent mixture)[5].
Secara umum, distribusi campuran yang saling bebas (independent mixture
distribution) terdiri dari sejumlah bilangan/komponen yang berhingga (๐ komponen)
dan distribusi pencampuran yang dipilih dari komponen tersebut. Misalkan ๐ฟ1 , … , ๐ฟ๐
adalah peluang pada masing-masing ๐ komponen dan misalkan ๐ 1 , … , ๐ ๐
adalah peluang fungsi densitas masing-masing komponen tersebut. Misalkan ๐
10
menyatakan variabel acak yang memiliki disribusi campuran. Peluang fungsi densitas
๐ didefinisikan sebagai[5]:
๐
๐ ๐ฅ =
๐ฟ๐ ๐๐ ๐ฅ
(2.8)
๐=1
Sehingga, untuk kasus diskrit, peluang fungsi densitas ๐ adalah[5]:
๐
Pr ๐ = ๐ฅ =
Pr ๐ = ๐ฅ ๐ถ = ๐ Pr ๐ถ = ๐
(2.9)
๐=1
Misalkan ๐๐ adalah komponen variabel acak dengan peluang fungsi densitas ๐ ๐ฅ .
Nilai harapan distribusi campuran X didefinisikan sebagai[5]:
๐
E ๐ =
๐
Pr ๐ถ = ๐ E ๐ ๐ถ = ๐ =
๐=1
๐ฟ๐ E ๐๐
(2.10)
๐=1
Secara umum, nilai harapan untuk distribusi campuran X dengan ๐ moment
adalah[5]:
๐
๐ฟ๐ E ๐๐ ๐ , ๐ ∈ โ
E ๐๐ =
(2.11)
๐=1
dimana nilai variansi campuran untuk kasus dua komponen adalah:
Var ๐ = ๐ฟ1 Var ๐1 + ๐ฟ2 Var ๐2 + ๐ฟ1 ๐ฟ2 (E ๐1 − E ๐2 )2
(2.12)
2.4 Rantai Markov
A. Pengantar Stokastik
Proses stokastik didefinisikan sebagai proses menyusun dan mengindeks
sekumpulan variabel acak { ๐ถ๐ก , ๐ก ≥ 0}, dengan indeks ๐ก berada pada sekumpulan
11
๐[6]. Sehingga ๐ dinamakan ruang parameter atau ruang indeks ∀ ๐ก ∈ ๐, dengan ๐ก
merupakan parameter bilangan bulat tak negatif yang merepresentasikan karakteristik
terukur yang kita perhatikan pada waktu ๐ก.
Himpunan variabel acak ๐ถ๐ก pada proses stokastik menggambarkan keadaaan
(state) sistem pada waktu ๐ก. State merupakan posisi atau keadaan yang akan
ditentukan klasifikasinya. Misalkan {๐ถ๐ก , ๐ก = 0,1,2, … , ๐} adalah barisan peubah acak
dengan ruang keadaan himpunan bilangan berhingga (finite). Jika ๐ถ๐ก = ๐, ๐ ∈ โค+,
maka kita katakan bahwa proses tersebut pada waktu ๐ก berada pada keadaan ๐.
B. Definisi Proses Markov
Pada tahun 1906, A.A. Markov seorang ahli matematika dari Rusia yang
merupakan murid Chebysev mengemukakan teori ketergantungan variabel acak dari
proses acak yang dikenal dengan proses Markov[7]. Proses Markov adalah proses
stokastik yang mempunyai sifat bahwa jika nilai ๐ถ๐ก telah diketahui, maka ๐ถ๐  di mana
๐  > ๐ก tidak dipengaruhi oleh ๐ถ๐ข di mana ๐ข < ๐ก. Dengan kata lain, Proses Markov
merupakan fenomena dimana kejadian masa datang hanya dipengaruhi oleh masa
sekarang dan tidak dipengaruhi oleh masa lalu.
C. Rantai Markov Diskrit
Analisis rantai Markov (Markov Chain Analysis) merupakan suatu teknik
peluang yang menganalisis pergerakan peluang dari suatu keadaan ke keadaan
12
lainnya. Proses stokastik {๐ถ๐ก โถ ๐ก ∈ โ} dikatakan sebuah rantai Markov dengan waktu
diskrit jika untuk setiap ๐ก ∈ โ berlaku[5]:
Pr ๐ถ๐ก+1 ๐ถ๐ก , ๐ถ๐ก−1 , … , ๐ถ1 ) = Pr ๐ถ๐ก+1 ๐ถ๐ก )
(2.13)
Definisi tersebut dapat diinterpretasikan bahwa untuk suatu rantai Markov, sebaran
bersyarat dari sembarang keadaan yang akan datang {๐ถ๐ก+1 } dengan syarat keadaan
pada masa lalu adalah {๐ถ๐ก−1 , … , ๐ถ1 } dan keadaan sekarang adalah {๐ถ๐ก }, adalah bebas
terhadap semua keadaan yang lalu dan hanya bergantung dari keadaan sekarang (kita
definisikan ๐ (๐ก) sebagai kejadian {๐ถ1 , ๐ถ2 , … , ๐ถ๐ก }). Persamaan (2.13) dapat ditulis
sebagai berikut[5]:
Pr ๐ถ๐ก+1 ๐ช(๐ก) ) = Pr ๐ถ๐ก+1 ๐ถ๐ก )
(2.14)
Kuantitas terpenting yang terkait dengan rantai Markov adalah peluang
bersyarat yang disebut dengan peluang transisi (transition probabilities) dimana pada
kasus rantai Markov homogen persamaannya adalah sebagai berikut:
๐พ๐๐ = Pr ๐ถ๐+1 = ๐ ๐ถ๐ = ๐)
(2.15)
untuk semua ๐, ๐, ๐ = {1,2, … }. Nilai ๐พ๐๐ merupakan elemen dari ๐ช(1), yaitu elemen
dari matriks peluang transisi satu langkah (one-step transition probabilities matrix).
Kita definisikan ๐ช 1 = ๐ช. Nilai ๐พ๐๐ menyatakan peluang bahwa jika proses rantai
Markov berada pada keadaan ๐, maka keadaan berikutnya ke keadaan ๐ setelah satu
langkah dan memenuhi syarat-syarat berikut[6]:
a. ๐พ๐๐ ≥ 0, untuk semua ๐, ๐ = {1, 2, 3, ..., ๐}
b.
๐พ๐๐ = 1, untuk semua ๐ = {1, 2, 3, ..., ๐}
13
dimana ๐ menyatakan banyaknya keadaan pada rantai Markov dengan jumlah
masing-masing baris pada matriks ๐ช sama dengan 1.
1
๐พ11
๐พ21
โฎ
๐พ๐1
2
๐พ12
๐พ22
โฎ
๐พ๐2
โฏ
โฏ
โฏ
โฑ
โฏ
๐
๐พ1๐
๐พ2๐
โฎ
๐พ๐๐
1
2
๐ช 1 = ๐ช =
โฎ
๐
Gambar 2.1 Matriks Peluang Transisi Satu Langkah
berukuran m × m
Pada peluang transisi ๐ก langkah, yaitu peluang bahwa suatau proses yang
mula-mula berada pada keadaan ๐ akan berpindah pada keadaan ๐ setelah ๐ก langkah
didefinisikan sebagai[5]:
๐พ๐๐ (๐ก) = Pr ๐ถ๐ +๐ก = ๐ ๐ถ๐  = ๐)
(2.16)
untuk semua ๐, ๐, ๐ , ๐ก ∈ โ. Nilai ๐พ๐๐ (๐ก) merupakan elemen matriks ๐ช(๐ก) (t-step
transition probabilities matrices). Berdasarkan persamaan Chapman Kolmogorov
matriks peluang transisi ๐ก langkah dapat ditentukan dengan mengalikan matriks ๐ช
sebanyak ๐ก kali dengan persamaan sebagai berikut[5]:
๐ช ๐ก + ๐ข = ๐ช ๐ก . ๐ช ๐ข , untuk semua ๐ก, ๐ข ∈ โ
(2.17)
Persamaan Chapman Kolmogorov mengimplikasikan bahwa
๐ช ๐ก = ๐ช 1 ๐ , untuk semua ๐ก ∈ โ
Sejauh ini, semua peluang yang ditentukan merupakan peluang bersyarat.
Misalnya ๐ช(๐ก) adalah peluang bahwa pada waktu ke ๐ก proses berada pada keadaan ๐
dengan syarat keadaan mula-mula adalah ๐. Pada sebaran tidak bersyarat rantai
Markov, nilai peluang sebaranya ditentukan oleh sebaran peluang pada keadaan awal
14
(initial state). Peluang tidak bersyarat (unconditional probabilities) Pr(๐ถ๐ก = ๐) dari
rantai Markov berada pada keadaan tertentu pada waktu ke ๐ก didefinisakan sebagai
vektor baris sebagai berikut[5]:
๐ฎ ๐ก = ( Pr ๐ถ๐ก = 1 , … , Pr ๐ถ๐ก = ๐ ), ๐ก ∈ โ
(2.18)
dimana ๐ฎ 1 merupakan peluang pada keadaaan awal (initial distribution) rantai
Markov. Sehingga, untuk mengetahui peluang keadaan pada waktu ๐ก + 1 diperoleh
persamaan[5]:
๐ฎ ๐ก+1 =๐ฎ ๐ก ๐ช
(2.19)
Sebagai contoh, misalkan peluang besok akan terjadi hujan bergantung pada
keadaan cuaca hari ini, serta tidak bergantung pada keadaan cuaca sebelumnya (sifat
rantai Markov). Misalkan diberikan peluang transisi satu langkah rantai Markov
dengan dua keadaan, dimana keadaan jika cuaca hujan = 1 dan jika cuaca cerah = 2
dengan peluang transisinya ditunjukkan pada tabel berikut:
Tabel 2.1 Peluang Keadaan Cuaca
๐ก+1
Hari ke
๐ก
Hujan
Cerah
Hujan
0,9
0,6
Cerah
0,1
0,4
Tabel di atas menjelaskan bahwa peluang cuaca besok akan hujan sebesar 0,9 dengan
syarat jika cuaca hari ini hujan dan sebesar 0,1 jika cuaca hari ini adalah cerah.
Matriks peluang transisi ๐ช untuk memodelkan kondisi di atas adalah:
๐ช =
1
2
1
2
0,9 0,1
0,6 0,4
15
Jika cuaca hari ini (๐ก = 1) adalah cerah, maka peluang tidak bersyarat cuaca hari ini
adalah (lihat Persamaan (2.18)):
๐ฎ 1 = Pr ๐ถ1 = 1 , Pr ๐ถ1 = 2
= (0 , 1)
dan peluang cuaca untuk ๐ก = {2, 3, … }, yaitu peluang cuaca pada hari-hari berikutnya
adalah (lihat Persamaan (2.19)):
๐ฎ 2 = Pr ๐ถ2 = 1 , Pr ๐ถ2 = 2
๐ฎ 3 = Pr ๐ถ3 = 1 , Pr ๐ถ3 = 2
= ๐ฎ 1 . ๐ช = (0,6 , 0,4)
= ๐ฎ 2 . ๐ช = (0,78 , 0,22), dan seterusnya.
Jadi, peluang tidak bersyarat jika cuaca hari ini cerah maka peluang bahwa cuaca 2
hari yang akan datang akan turun hujan sebesar 0,78 dan cuaca akan cerah sebesar
0,22.
Pada rantai Markov, setelah proses Markov berjalan dalam jangka yang
panjang (๐ก → ∞), peluang yang dihasilkan akan bernilai tetap, dengan kata lain akan
menuju stasioner. Hal ini berarti, proses Markov memiliki peluang yang konvergen
ke suatu nilai yang sama, dimana proses tersebut tidak lagi bergantung pada keadaan
awal (๐ 1 ). Rantai Markov dengan matriks peluang transisi ๐ช, dikatakan memiliki
distribusi yang stasioner ๐น (vektor baris dengan elemen tak negatif) jika[5]:
๐
๐
๐ช = ๐
 dan
๐ฟ๐ = 1
(2.20)
๐=1
Dalam contoh kasus cuaca sebelumnya, perhitungan ๐
 yang stasioner pada rantai
Markov dengan matriks peluang transisi keadaan cuaca ๐ช diperoleh dengan
menggunakan Sistem Persamaan Linear (SPL) sebagai berikut:
16
๐ฟ1 = 0,9๐ฟ1 + 0,6๐ฟ2 dan ๐ฟ1 + ๐ฟ2 = 1
sehingga diperoleh ๐ฟ1 =
6
7
dan ๐ฟ2 =
1
7
atau dapat ditulis ๐
 =
jangka panjang, peluang cuaca cerah akan konvergen ke
1
7
1
7
(6 , 1). Artinya, dalam
dan peluang cuaca hujan
6
konvergen ke .
7
2.5 Poisson Hidden Markov Models (PHMMs)
Poisson Hidden Markov Models (PHMMs) merupakan perluasan dari HMMs
(Hidden Markov Models), dimana setiap observasinya dihasilkan oleh salah satu dari
๐ keadaan tersembunyi (hidden state) yang berdistribusi Poisson. Dalam memahami
PHMMs, berikut dijelaskan mengenai dasar teori Hidden Markov Model (HMM),
distribusi marginal dan moment HMM, serta likelihood HMM.
1. Hidden Markov Model (HMM)
Hidden Markov Model merupakan sebuah proses stokastik yang terdiri dari
dua bagian. Bagaian pertama adalah bagian yang tidak teramati (unobserved)
{๐ถ๐ก , ๐ก ∈ โ} yang memenuhi sifat Markov, yang disebut juga sebagai “proses
parameter”
(parameter
process).
Bagian
kedua
adalah
bagian
yang
teramati/terobservasi {๐๐ก , ๐ก ∈ โ}, yang disebut juga sebagai “proses keadaan
bergantung” (state-dependent process) dimana distribusi ๐๐ก hanya bergantung pada
kondisi saat ๐ถ๐ก dan bukan bergantung pada keadaan terobservasi sebelumnya ๐๐ก−1 .
Representasi HMMs ditunjukkan pada Gambar 2.7[5].
17
Gambar 2.2 Graf Dasar HMM
Hidden Markov Model {๐๐ก , ๐ก ∈ โ} merupakan distribusi campuran yang
bergantung, dengan ๐ (๐ก) dan ๐ (๐ก) mewakili kejadian masa lalu dari waktu 1 hingga
waktu ๐ก, yang disimpulkan model sederhana tersebut dengan persamaan[5]:
Pr ๐ถ๐ก ๐ (๐ก−1) ) = Pr ๐ถ๐ก ๐ถ๐ก−1 ), ๐ก = 2, 3, …
(2.21)
Pr ๐๐ก ๐ (๐ก−1) , ๐ (๐ก) ) = Pr ๐๐ก ๐ถ๐ก ), ๐ก ∈ โ
(2.22)
Jika rantai Markov {๐ถ๐ก } mempunyai ๐ keadaaan tersembunyi, kita katakan {๐๐ก }
adalah HMM dengan ๐ keadaaan.
Pada kasus pengamatan diskrit, jika rantai Markov pada waktu ๐ก berada pada
keadaan ๐ maka fungsi masa peluang (pmf) ๐๐ก didefinisikan sebagai[5]:
๐๐ ๐ฅ = Pr ๐๐ก = ๐ฅ ๐ถ๐ก = ๐), ๐ = 1, 2, … , ๐
(2.23)
Distribusi ๐๐ dengan ๐ keadaan tersembunyi dapat dikatakan sebagai distribusi
keadaan bergantung (state-dependent distributions).
2. Distribusi Marginal dan Moment HMM
Didefinisikan ๐ข๐ ๐ก = Pr(๐ถ๐ก = ๐) untuk ๐ก = 1, … , ๐. Distribusi univariat
observasi ๐๐ก untuk nilai diskrit sebagai berikut[5]:
18
๐
Pr ๐๐ก = ๐ฅ =
Pr(๐ถ๐ก = ๐)โกPr ๐๐ก = ๐ฅ ๐ถ๐ก = ๐)
๐=1
๐
=
๐ข๐ ๐ก ๐๐ ๐ฅ
(2.24)
๐=1
Persamaan (2.21) dapat ditulis kedalam bentuk matriks sebagai berikut:
Pr ๐๐ก = ๐ฅ = ๐ข1 ๐ก , … , ๐ข๐ ๐ก
๐1 ๐ฅ
โฎ
0
โฑ
0
โฎ
๐๐ ๐ฅ
1
โฎ
1
= ๐ฎ ๐ก ๐ ๐ฅ ๐′
dimana ๐ ๐ฅ didefinisikan sebagai matrik diagonal utama dengan elemen diagonal
utama ke ๐ adalah ๐๐ ๐ฅ . Berdasarkan Persamaan (2.19) bahwa ๐ฎ ๐ก = ๐ฎ 1 ๐ช ๐ก−1
diperoleh:
Pr ๐๐ก = ๐ฅ = ๐ข 1 ๐ช ๐ก−1 ๐ ๐ฅ ๐′
(2.25)
Persamaan (2.25) berlaku jika rantai Markov adalah homogen dan tidak harus
stasioner. Jika kita asumsikan rantai Markov stasioner dengan distribusi stasioner ๐
,
dimana ๐
๐ช ๐ก−1 = ๐น maka[5]:
Pr ๐๐ก = ๐ฅ = ๐
๐ ๐ฅ ๐′
(2.26)
Pada kasus distribusi bivariat, dimana terdapat empat variabel acak
๐๐ก , ๐๐ก+๐ , ๐ถ๐ก , ๐ถ๐ก+๐ dengan ๐ ∈ +โค, distribusi marginalnya adalah[5]:
Pr ๐๐ก = ๐ฃ, ๐๐ก+๐ = ๐ค
๐
๐
=
Pr ๐๐ก = ๐ฃ, ๐๐ก+๐ = ๐ค, ๐ถ๐ก = ๐, ๐ถ๐ก+๐ = ๐ โกโก
๐=1 ๐ =1
19
๐
๐
=
Prโก
(๐ถ๐ก = ๐) ๐๐ ๐ฃ Pr(๐ถ๐ก+๐ = ๐|๐ถ๐ก = ๐) ๐๐ (๐ค)โกโก
๐=1 ๐ =1
๐
๐
=
๐ข๐ ๐ก ๐๐ ๐ฃ ๐พ๐๐ (๐) ๐๐ (๐ค)โก
(2.27)โก
๐=1 ๐ =1
Persamaan (2.27) dapat ditulis kedalam bentuk matriks sebagai berikut:
Pr ๐๐ก = ๐ฃ, ๐๐ก+๐ = ๐ค = ๐ฎ ๐ก ๐ ๐ฃ ๐ช ๐ ๐ ๐ค ๐′
(2.28)
Jika rantai Markov stasioner maka:
Pr ๐๐ก = ๐ฃ, ๐๐ก+๐ = ๐ค = ๐
๐ ๐ฃ ๐ช ๐ ๐ ๐ค ๐′
(2.29)
Pada kasus stasioner, nilai harapan keadaan bergantung (state-dependent)
E ๐(๐๐ก ) dan E ๐(๐๐ก , ๐๐ก+๐ ) untuk setiap fungsi ๐ adalah sebagai berikut:
๐
E ๐(๐๐ก ) =
๐ฟ๐ E ๐(๐๐ก ) ๐ถ๐ก = ๐
(2.30)
๐=1
dan
๐
E ๐(๐๐ก , ๐๐ก+๐ ) =
E ๐(๐๐ก , ๐๐ก+๐ |๐ถ๐ก = ๐, ๐ถ๐ก+๐ = ๐) ๐ฟ๐ ๐พ๐๐ (๐)
๐,๐ =1
๐
=
E ๐1 ๐๐ก ๐ถ๐ก = ๐
E ๐2 (๐๐ก+๐ )|๐ถ๐ก+๐ = ๐ ๐ฟ๐ ๐พ๐๐ ๐
(2.31)
๐,๐ =1
dimana ๐ ๐๐ก , ๐๐ก+๐ = ๐1 (๐๐ก )๐2 (๐๐ก+๐ ) dan ๐พ๐๐ ๐ = (๐ช ๐ )๐๐ , untuk setiap ๐ ∈ โ.
Persamaan (2.30) dan Persamaan (2.31) berguna untuk mendapatkan nilai kovarian
dan korelasi pada HMMs. Sebagai contoh, misalkan jika terdapat dua keadaan HMM
dimana rantai Markov berdistribusi Poisson dan stasioner maka:
20
E ๐๐ก = ๐ฟ1 ๐1 + ๐ฟ2 ๐2 ;
Var ๐๐ก = E ๐๐ก + ๐ฟ1 ๐ฟ2 ๐2 − ๐1
2
≥ E ๐๐ก ;
Cov ๐๐ก , ๐๐ก+๐ = ๐ฟ1 ๐ฟ2 ๐2 − ๐1 2 (1 − ๐พ12 − ๐พ21 )๐ , untuk setiap ๐ ∈ โ.
3. Likelihood HMMs
Misalkan diketahui barisan observasi ๐ฅ1 , ๐ฅ2 , … , ๐ฅ๐ yang dihasilkan oleh
model. Peluang likelihood ๐ฟ๐ pada barisan obsevasi tersebut dimana diberikan ๐
keadaaan HMM yang memiliki distrbusi inisial/awal ๐
 dan matriks peluang transisi ๐ช
pada rantai Markov, dan peluang keadaan bergantung (state-dependent probability)
๐๐ yang merupakan elemen dari matriks ๐ ๐ฅ sebagai berikut[5]:
๐ฟ๐ = Pr ๐
๐ป
=๐ฑ
๐ป
= ๐
๐ ๐ฅ1 ๐ช๐ ๐ฅ2 ๐ช๐ ๐ฅ3 … ๐ช๐(๐ฅ๐ )๐′
(2.32)
Jika ๐
, yaitu distribusi ๐ถ1 adalah distribusi stasioner pada rantai Markov, maka:
๐ฟ๐ = Pr ๐
๐ป
=๐ฑ
๐ป
= ๐
๐ช๐ ๐ฅ1 ๐ช๐ ๐ฅ2 ๐ช๐ ๐ฅ3 … ๐ช๐(๐ฅ๐ )๐′
Misalkan kita definisikan vektor ๐ถ๐ก , untuk ๐ก = 1, 2, … , ๐ (lihat Persamaan (2.32))
dengan
๐ก
๐ถ๐ก = ๐
๐ ๐ฅ1 ๐ช๐ ๐ฅ2 … ๐ช๐ ๐ฅ๐ก = ๐
๐ ๐ฅ1
๐ช๐(๐ฅ๐  )
๐ =2
Sehingga kita peroleh:
๐ถ1 = ๐
๐ ๐ฅ1
๐ถ๐ก = ๐ถ๐ก−1 ๐ช๐ ๐ฅ๐ก untuk ๐ก = 2, 3, … , ๐
๐ฟ๐ = ๐ถ ๐ ๐′
21
dengan ๐ถ0 = ๐
 untuk kasus rantai Markov stasioner. Elemen dari ๐ถ๐ก biasanya
dikenal dengan peluang forward dimana akan dijelaskan pada sub bab berikutnya[5].
2.6 Penskalaan Komputasi Likelihood (Scaling the Likelihood Computation)
Pada kasus distribusi state-dependent diskrit, hasil peluang elemen ๐ถ๐ก akan
semakin kecil nilainya saat ๐ก meningkat, dan pada akhirnya dibulatkan menjadi 0,
atau biasa disebut underflow. Salah satu cara dalam mengatasi masalah underflow
digunakan penskalaan likelihood, yaitu menghitung nilai log dari likelihood, atau bisa
disebut dengan penskalaan vektor peluang forward ๐ถ๐ก . Didefinisikan sebuah vektor,
untuk ๐ก = 0,1, … , ๐ adalah[5]:
๐๐ก = ๐ถ๐ก /๐ค๐ก
dimana ๐ค๐ก =
๐ ๐ผ๐ก (๐)
= ๐ถ๐ก ๐′.
Pertama kita perhatikan akibat langsung dari definisi ๐๐ก dan ๐ค๐ก :
๐ค0 = ๐ถ0 ๐′ = ๐
๐′ = 1;
๐๐ก = ๐
;
๐ค๐ก ๐๐ก = ๐ค๐ก−1 ๐๐ก−1 ๐๐ก ;
(2.33)
๐ฟ ๐ = ๐ถ ๐ ๐ ′ = ๐ค๐ ๐ ๐ ๐ ′ = ๐ค๐
dimana kita definisikan ๐๐ก adalah sebuah matriks dengan ๐๐ก = ๐ช๐ ๐ฅ๐ก . Karena
๐ฟ ๐ = ๐ค๐ =
๐
๐ก=1(๐ค๐ก /๐ค๐ก−1 ),
berdasarkan Persamaan (2.33) diperoleh:
๐ค๐ก = ๐ค๐ก−1 (๐๐ก−1 ๐๐ก ๐′)
dan sehingga
22
๐
log ๐ฟ๐ =
๐ก=1
๐ค๐ก
log
=
๐ค๐ก−1
๐
log ๐๐ก−1 ๐๐ก ๐′
2.34
๐ก=1
2.7 Estimasi Algoritma EM (Expectation Maximisation Algorithm) pada HMM
Salah satu metode umum yang digunakan untuk mengestimasi parameterparameter pada HMMs adalah dengan menggunakan metode Algoritma EM
(Estimation Maximization Algorithm). Dalam konteks HMMs, algoritma EM dikenal
sebagai algoritma Baum-Welch, dimana rantai Markov pada HMM adalah homogen
dan tidak diharuskan stasioner. Parameter HMM yang diestimasi dengan Algoritma
EM adalah distribusi keadaan bergantung ๐๐ , matriks peluang transisi ๐ช, dan
distribusi inisial ๐
. Dalam penerapannya, Algoritma EM membutuhkan perangakat
yaitu peluang forward dan peluang backward, dimana kedua peluang tersebut dapat
digunakan untuk prediksi state[5].
1. Peluang Forward
Peluang forward ๐ถ๐ก untuk ๐ก = 1, 2, … , ๐ didefinisikan sebagai vektor baris[5]:
๐ก
๐ถ๐ก = ๐
๐ ๐ฅ1 ๐ช๐ ๐ฅ2 … ๐ช๐ ๐ฅ๐ก = ๐
๐ ๐ฅ1
๐ช๐(๐ฅ๐  )
(2.35)
๐ =2
dengan ๐น adalah distribusi inisial rantai Markov. Berdasarkan definisi peluang
forward di atas, untuk ๐ก = 1, 2, … , ๐ −1, dapat ditulis ๐ถ๐ก+1 = ๐ถ๐ก ๐ช๐ ๐ฅ๐ก+1 , atau
dalam bentuk skalar:
๐
๐ผ๐ก+1 ๐ =
๐ผ๐ก ๐ ๐พ๐๐ ๐๐ ๐ฅ๐ก+1 ,
๐=1
23
Artinya, ๐ผ๐ก ๐ dimana ๐ adalah komponen ๐ถ๐ adalah peluang bersama Pr(๐1 =
๐ฅ1 , ๐2 = ๐ฅ2 , … , ๐๐ก = ๐ฅ๐ก , ๐ถ๐ก = ๐)
Dalil Peluang Forward[5]:
Untuk ๐ก = 1, 2, … , ๐ dan ๐ = 1, 2, … , ๐,
๐ผ๐ก ๐ = Pr ๐
๐ก
= ๐ฑ ๐ก , ๐ถ๐ก = ๐
2. Peluang Backward
Peluang backward ๐ท๐ก untuk ๐ก = 1, 2, … , ๐ didefinisikan sebagai vektor baris[5]:
๐ก
๐ท′๐ก = ๐ช๐ ๐ฅ๐ก+1 ๐ช๐ ๐ฅ๐ก+2 … ๐ช๐ ๐ฅ๐ ๐′ =
๐ช๐ ๐ฅ๐ 
๐′
(2.36)
๐ =๐ก+1
dimana untuk ๐ก = ๐, ๐ท ๐ = 1. Berdasarkan definisi peluang backward di atas,
untuk ๐ก = 1, 2, … , ๐ −1, dapat ditulis ๐ท′๐ก = ๐ช๐ ๐ฅ๐ก+1 ๐ท′๐ก+1 .
Dalil Peluang Backward[5]:
Untuk ๐ก = 1, 2, … , ๐ − 1 dan ๐ = 1, 2, … , ๐,
๐ฝ๐ก ๐ = Pr ๐๐ก+1 = ๐ฅ๐ก+1 , ๐๐ก+2 = ๐ฅ๐ก+2 , … , ๐๐ = ๐ฅ๐ , ๐ถ๐ก = ๐ ,
dengan ketentuan bahwa Pr ๐ถ๐ก = ๐ > 0. Dalam notasi lebih sederhana dapat
ditulis:
๐
๐ฝ๐ก ๐ = Pr ๐ ๐๐ก+1 = ๐ฑ ๐ก+1
๐ถ๐ก = ๐ ,
dimana ๐ ๐๐ merupakan vektor (๐๐ , ๐๐+1 , … , ๐๐ ).
Dalil di atas mengidentifikasi ๐ฝ๐ก (๐) sebagai peluang bersyarat, yaitu peluang
obeservasi ๐ฅ๐ก+1 , … , ๐ฅ๐ dimana diberikan rantai Markov berada pada keadaan ๐
pada waktu ๐ก.
24
3. Peluang Forward dan Peluang Backward
Gabungan antara peluang forward dan peluang backward ๐ผ๐ก dan ๐ฝ๐ก dapat
diterapkan untuk menghitung peluang Pr ๐
๐
=๐ฑ
๐
, ๐ถ๐ก = ๐ , dimana gabungan
peluang tersebut dibutuhkan dalam pengaplikasian algoritma EM pada HMMs.
Dalil Peluang Forward dan Peluang Backward[5]:
Untuk ๐ก = 1, 2, … , ๐ dan ๐ = 1, 2, … , ๐,
๐ผ๐ก ๐ ๐ฝ๐ก ๐ = Pr ๐
dan akibatnya ๐ถ๐ ๐ท′๐ = Pr ๐
๐
=๐ฑ
๐
๐
=๐ฑ
๐
, ๐ถ๐ก = ๐ ,
= ๐ฟ๐ , untuk setiap ๐ก.
Dan dalam pengaplikasian algoritma EM pada HMMs juga dibutuhkan dua sifat
berikut[5]:
Dalil Peluang Forward dan Peluang Backward[5]:
Petama, untuk ๐ก = 1, 2, … , ๐,
Pr ๐ถ๐ก = ๐ ๐
๐
=๐ฑ
๐
= ๐ผ๐ก ๐ ๐ฝ๐ก ๐ / ๐ฟ๐ ;
(2.37)
dan yang kedua, untuk ๐ก = 2, … , ๐
Pr ๐ถ๐ก−1 = ๐, ๐ถ๐ก = ๐ ๐
๐
=๐ฑ
๐
= ๐ผ๐ก−1 ๐ ๐พ๐๐ ๐๐ ๐ฅ๐ก ๐ฝ๐ก ๐ / ๐ฟ๐ (2.38)
Pada HMM, yaitu dimana barisan keadaan rantai Markov tidak teramati,
dimungkinkan terdapat data hilang (missing value) pada barisan tersebut, yang
berakibat data tidak lengkap (incomplete data). Algoritma EM merupakan sebuah
metode iteratif yang juga berfungsi untuk menghitung estimasi maksimum likelihood
(maximum likelihood estimation) untuk data tidak lengkap, sehingga diperoleh data
25
lengkap log-likelihood[5]. Dalam setiap iterasi Algoritma EM terdapat 2 tahap, yaitu
tahap Ekspektasi atau tahap E (E-step) dan tahap Maksimisasi atau tahap M (M-step).
Pada kasus HMM, barisan keadaan ๐1 , ๐2 , … , ๐๐ rantai Markov dengan
variabel acak nol-satu didefinisikan sebagai[5]:
๐ข๐ ๐ก = 1 jika dan hanya jika ๐๐ก = ๐, (๐ก = 1, 2, … , ๐)
dan
๐ฃ๐๐ ๐ก = 1 jika dan hanya jika ๐๐ก−1 = ๐ dan ๐๐ก = ๐ (๐ก = 2, 3, … , ๐).
Data lengkap log-likelihood (CDLL) HMM, yaitu dimana terdapat barisan observasi
๐ฅ1 , ๐ฅ2 , … , ๐ฅ๐ serta data hilang ๐1 , ๐2 , … , ๐๐ , adalah[5]:
log Prโก
(๐
๐ป
,๐
๐ป
)
๐
๐
๐
๐ข๐ 1 log ๐ฟ๐ +
=
๐ =1
๐
๐
๐ฃ๐๐ ๐ก
๐ =1 ๐=1
๐
log ๐พ๐๐ +
๐ก=2
๐ข๐ ๐ก log ๐๐ ๐ฅ๐ก
(2.39)
๐ =1 ๐ก=1
= Bentuk 1 + Bentuk 2 + Bentuk 3
dimana ๐น adalah distribusi inisial rantai Markov (distribusi ๐ถ1 ) yang tidak diharuskan
stasioner. Proses atau 2 tahapan Algoritma EM pada HMM adalah sebagai berikut:
1. Tahap E (E-step)
Mengganti semua nilai ๐ฃ๐๐ dan ๐ข๐ ๐ก
diberikan observasi ๐ฑ
๐
dengan ekpektasi bersyaratnya jika
[5]:
๐ข๐ ๐ก = Pr ๐ถ๐ก = ๐| ๐ฑ
๐
= ๐ผ๐ก ๐ ๐ฝ๐ก ๐ /๐ฟ๐ ;
(2.40)
dan
๐ฃ๐๐ ๐ก = Pr ๐ถ๐ก−1 = ๐, ๐ถ๐ก = ๐| ๐ฑ
๐
= ๐ผ๐ก−1 ๐ ๐พ๐๐ ๐๐ ๐ฅ๐ก ๐ฝ๐ก ๐ /๐ฟ๐ .
(2.41)
26
Sebagai catatan bahwa dalam perhitungan pada E-step, diperlukan peluang
forward dan peluang backward pada HMM (Persamaan (2.37) dan Persamaan
(2.38), dimana untuk peluang forward tidak mengasumsikan rantai Markov{๐ถ๐ก }
stasioner. Akan tetapi pada peluang backward tidak terpengaruh dengan
stasioneritas rantai Markov{๐ถ๐ก }[5].
2. Tahap M (M-step)
Setelah mengganti nilai ๐ฃ๐๐ dan ๐ข๐ ๐ก
dengan ๐ข๐ ๐ก
dan ๐ฃ๐๐ ๐ก , langkah
berikutnya adalah memaksimalkan CDLL (Persamaan (2.39)), yang berkenaan
dengan tiga set parameter, yaitu distribusi inisial ๐น, matriks peluang transisi ๐ช,
dan parameter distribusi state-dependen (dalam kasus Poisson-HMM adalah
๐1 , ๐2 , … , ๐3 )[5].
Kedua langkah algoritma EM di atas diulang hingga mencapai kekonvergenan pada
masing-masing parameter.
2.8 Pemilihan Model berdasarkan AIC (Akaike Information Criterion)
Akaike Information Criterion (AIC) diperkenalkan pertama kali oleh Akaike
(1974) untuk mengidentifikasikan model dari suatu dataset. Metode ini merupakan
salah satu dari metode yang menerapkan pendekatan Maximum Likelihood[9].
Persamaan AIC dalam melakukan pemilihan model adalah sebagai berikut[5]:
๐๐๐ = −2 log ๐ฟ + 2๐,
(2.42)
dimana log ๐ฟ adalah log-likelihood pada model dan ๐ adalah banyaknya parameter
bebas pada model. Misalakan, jika model diberikan 2 keadaan tersembunyi ๐ = 2,
27
maka model tersebut memiliki parameter bebas sebanyak ๐ = ๐2 + ๐ − 1 = 5. Hal
tersebut dikarenakan parameter ๐ช memiliki parameter bebas sebanyak ๐2 , parameter
๐
 sebanyak ๐ − 1, dan parameter ๐ sebanyak ๐ parameter bebas.
28
BAB III
METODOLOGI PENELITIAN
3.1 Sumber Data
Data yang digunakan dalam penelitian ini adalah data gempa bumi
Wilayah II dari mulai tanggal 4 Maret 2008 hingga 17 Desember 2013. Data yang
diambil berbentuk data sekunder yang diambil dari Balai Besar Meteorologi dan
Geofisika Wilayah II Ciputat dengan cakupan wilayah dari Propinsi Sumatra
Barat (Sumbar) hingga Propinsi Nusa Tenggara Timur (NTT). Dari data tersebut
menjelaskan waktu, sistem koordinat, kedalaman serta besarnya kekuatan pada
gempa bumi yang terjadi. Berikut adalah data gempa bumi wilayah dari Propinsi
Sumatra Barat hingga Propinsi Nusa Tenggara Timur:
Tabel 3.1 Data Gempa Bumi di Propinsi Sumatra Barat sampai Propinsi Nusa
Tenggara Timur Tahun 2008-2013
Tanggal/Bulan/Tahun
Jam
Menit
Detik
Lintang
Bujur
Kedalaman
(Km)
Magnitudo
(SR)
04/03/2008
09
45
41,0
-3,26
102,06
10,00
4,2
16/03/2008
23
05
28,0
-2,95
100,80
57,00
5,4
19/03/2008
11
18
21,0
-3,09
102,15
25,00
4,4
20/03/2008
08
26
53,9
-8,33
104,25
33,00
4,4
....
....
....
....
....
....
....
....
13/12/2013
05
29
41
-6,74
102,66
30,18
4,9
13/12/2013
15
22
12
-6,82
102,59
33,05
4,3
16/12/2013
09
03
11
-6,80
102,58
34,31
5,0
29
3.2 Tahap Persiapan Data
Berdasarkan tujuan penelitian ini, yaitu mencari model estimasi
banyaknya gempa bumi terbaik menggunakan metode estimasi algoritma EM
(Estimation Maximization algorithm) pada PHMM (Poisson Hidden Markov
Models), maka data yang perlu dipersiapkan adalah data banyaknya gempa bumi.
Peneliti menyaring data pada Tabel 3.1 berdasarkan kriteria kekuatan gempa
bumi, yaitu gempa bumi dengan magnitudo ≥5 Skala Richter yang terjadi
kedalaman gempa bumi dangkal yaitu ≤60 Km dari permukaan terjadinya gempa
bumi tersebut[12]. Data hasil penyaringan, selanjutnya dihitung banyaknya gempa
bumi yang terjadi dalam kurun waktu atau periode tertentu dengan kriteria yang
sudah dijelaskan di atas.
Dari proses pengambilan data banyaknya gempa bumi di atas, data
memiliki karakteristik distribusi Poisson. Sehingga, langkah berikutnya adalah
melakukan pengecekan overdispersi data terhadap distribusi Poisson, yaitu
dengan membandingkan nilai rata-rata dan variansi dari data banyaknya gempa
bumi. Jika nilai variansi lebih besar dibandingkan dengan nilai rata-ratanya, maka
data terjadi overdispersi terhadap distribusi Poisson.
3.3 Tahap Pemodelan
A. Penentuan Parameter Input
Penentuan Parameter Input merupakan tahapan dalam mencari nilai
parameter awal untuk masing-masing model, yaitu mencari parameter rata-rata
banyaknya gempa bumi ๐๐ = ๐1 , … , ๐๐ dimana untuk setiap ๐๐ memliki kriteria
30
distribusi Poisson dengan peluang awal kejadiannya ๐
 dan matriks peluang
transisi ๐ช. Sebagai contoh, misalkan diketahui barisan variabel acak banyaknya
peristiwa gempa bumi {๐๐ก , ๐ก = 1, … , 50 } hasil dari suatu observasi dengan
periode tertentu, dimana ๐๐ก memiliki karakteristik distribusi Poisson sebagai
berikut:
๐๐ก = {7,7,12,8,7,7,4,6,8,8,7,8,7,4,1,3,8,9,10,11,10,2,6,12,10,16,7,1,
5,6,4,11,12,7,15,10,10,2,5,5,10,13,16,11,5,6,7,14,11,14}
Karena s 2 ≈ 14,01 > ๐ฅ ≈ 8,1 maka terjadi overdispersi terhadap distribusi
Poisson. Sehingga, diduga terdapat pengelompokan data yang tidak teramati
(unobseved) pada variabel observasi, misalkan pada periode tertentu, rata-rata
banyaknya peristiwa gempa bumi terjadi dengan intensitas tinggi dan sedikit.
Misalkan diberikan 2 kelompok keadaan tersembunyi (๐ = 2) dengan kelompok
tersembunyi 1 panjang interval kelas banyaknya gempa bumi dari 1 sampai 6 dan
interval kelas sisanya masuk dikelompok tersembunyi 2. Berdasarkan pembagian
kelompok di atas diperoleh tiga parameter sebagai berikut:
1. ๐1 = (4+6+4+1+3+2+6+1+5+6+4+2+5+5+5+6)/16
= 4,0625
๐2 = (7+7+12+8+7+7+8+8+7+8+7+8+9+10+11+10+12+10+16+7+11+
12+7+15+10+10+10+13+16+11+7+14+11+14)/34
= 10
2. ๐ฟ1 =
๐ฟ2 =
16
50
34
50
= 0,32
= 0,68
31
3. ๐ช =
๐1
๐2
๐1
๐2
9/15
6/33
6/15
27/33
๐1
=
๐1
๐2
๐2
0,6
0,4
0,18 0,82
Dari hasil perhitungan di atas, dipeoleh nilai rata-rata kejadian gempa
bumi pada kelompok 1 sebesar 4,0625 dan pada kelompok 2 sebesar 10 kejadian,
atau dapat dinotasikan dalam bentuk vektor baris ๐ = (4,0625 , 10), dengan
peluang inisial/awal kejadiannya ๐
 =(0,32 , 0,68) dan mariks peluang transisi
kelompok keadaan tersembunyi ๐ช. Berlaku juga untuk model dengan ๐ = {3,4,5}
dalam mendapatkan ketiga parameter tersebut. Ketiga perameter, yaitu ๐, ๐
, dan ๐ช
pada masing-masing model kemudian dimasukkan kedalam software R versi
2.12.0 sebagai parameter input untuk mendapatkan model estimasi parameter
tersebut.
B. Estimasi Parameter PHMMs dengan Algoritma EM
Salah satu metode umum yang digunakan dalam mengestimasi HMMs
adalah dengan menggunakan metode Algoritma EM (Estimation Maximization
algorithm). Perangakat yang diperlukan sebelum menerapkan Algoritma EM
adalah menghitung nilai peluang forward dan peluang backward yang
ditunjukkan pada Persamaan (2.35) dan Persamaan (2.36). Masing-masing hasil
dari peluang forward dan peluang backward tersebut kemudian dilakukan
penskalaan likelihood (Scaling the Likelihood Computation) untuk mengatasi
32
kasus underflow yang ditunjukkan pada Persamaan (2.34). Berikut adalah
algoritma dalam penerapan penskalaan likelihood pada Persamaan (2.34):
set ๐0 ← ๐
 dan ๐ ← 0
untuk ๐ก = 1, 2, ... , ๐
๐ฏ ← ๐๐ก−1 ๐ช๐ ๐ฅ๐ก
๐ข ← ๐ฏ๐′
๐ ← ๐ + log ๐ข
๐๐ก = ๐ฏ/๐ข
return l
Sebagai catatan bahwa ๐ช dan ๐ ๐ฅ๐ก adalah matriks berukuran ๐ × ๐, ๐ฏ dan ๐ข
adalah vektor dengan panjang ๐, dan ๐ adalah skalar log-likelihood yang
diakumulasikan.
Algoritma EM terdiri dari dua langkah yaitu Tahap E (E step) dan Tahap
M (M step). Tahap E merupakan langkah dalam menghitung ekspektasi bersyarat
dari data yang hilang (missing data) berdasarkan Persamaan (2.40) dan Persamaan
(2.41). Hasil dari E step kemudian mengganti data pengamatan yang hilang
sehingga diperoleh data lengkap log-likelihood (complete data log-likelihood).
Dari data lengkap log-likelihood kemudian dimaksimalkan pada Tahap M untuk
masing-masing bentuk (lihat Persamaan (2.39)). Berikut adalah solusi dalam
penerapan pada Tahap M:
๏ Bentuk 1
Set → ๐ฟ๐ = ๐ข๐ 1 /
๐
๐ =1 ๐ข๐
1 = ๐ข๐ 1
๏ Bentuk 2
Set → ๐พ๐๐ = ๐๐๐ /
๐
๐=1 ๐๐๐ ,
dimana ๐๐๐ =
๐
๐ก=2 ๐ฃ๐๐
๐ก .
33
๏ Bentuk 3
untuk Poisson-HMM, ๐๐ ๐ฅ = ๐ −λ ๐ . λ๐ ๐ฅ /๐ฅ!
Set → 0 =
๐ข๐ ๐ก (−1 + ๐ฅ๐ก /λ๐ );
๐ก
sehingga:
๐
Set → λ๐ =
๐
๐ข๐ ๐ก ๐ฅ๐ก
๐ก=1
๐ข๐ ๐ก .
๐ก=1
3.4 Pemilihan Model Terbaik
Kriteria dalam pemilihan model estimasi terbaik pada penelitian ini adalah
berdasarkan nilai AIC (Akaike Information Criterion). Kriteria AIC didefinisikan
pada Persamaan (2.42), yaitu:
AIC = −2 ๐๐๐ ๐ฟ + 2๐,
dimana ๐๐๐ ๐ฟ adalah nilai log-likelihood masing-masing model dan ๐ adalah
jumlah parameter pada model tersebut. Pada penelitian ini akan dicari 3 model
estimasi dengan menggunakan metode Algoritma EM, yaitu model dengan
keadaan tersembunyi ๐ = (2, 3, 4). Model estimasi terbaik berdasarkan kriteria
AIC adalah model yang memiliki nilai AIC terkecil.
34
3.5 Alur Penelitian
Mulai
Data
Tahap Persiapan
Data
Penyaringan Data
Pengecekan
Overdispersi
Tahap Pemodelan
Penentuan input
Parameter PHMMs
Menghitung
Banyaknya Gempa
Menghitung Peluang
Forward dan Backward
Penskalaan
Likelihood
Estimasi Parameter
Algoritma EM
Kesimpulan
(Model Terbaik)
Selesai
Gambar 3.1 Alur Penelitian
35
BAB IV
HASIL DAN PEMBAHASAN
4.1 Deskripsi Data
Data dalam penelitian ini adalah data gempa bumi di sepanjang Propinsi
Sumatra Barat (Sumbar) sampai Propinsi Nusa Tenggara Timur (NTT) dari
tanggal 4 Maret 2008 hingga tahun 17 Desember 2013 yang kemudian disaring
berdasarkan besarnya magnitudo yaitu ≥5 Skala Richter yang terjadi pada
kedalaman gempa bumi dangkal yaitu ≤60 Km dari permukaan terjadinya gempa
bumi tersebut[12]. Kriteria penyaringan data tersebut didasarkan pada besarnya
resiko dan bahaya yang ditimbulkan oleh gempa bumi tersebut, khususnya bagi
masyarakat di sepanjang wilayah yang diamati. Berikut adalah data gempa bumi
dari hasil penyaring berdasarkan magnitudo dan kedalaman yang telah ditentukan
di atas:
Tabel 4.1 Data Gempa Bumi di Propinsi Sumatra Barat
sampai Propinsi Nusa Tenggara Timur dengan Magnitudo ≥5 SK
pada Kedalaman ≤60 Km Tahun 2008-2013
Tanggal/Bulan/Tahun
Lintang
Bujur
Kedalaman
(Km)
Magnitudo
(SR)
16/3/2008
-2,95
100,80
57
5,4
31/3/2008
-3,00
100,89
20
5,2
02/4/2008
-4,26
102,64
31
6,1
03/4/2008
-4,19
102,22
20
5,0
...
...
...
...
...
28/11/2013
-0,26
98,562
51,39
5,1
10/12/2013
-57,27
101,99
11,62
5,3
16/12/2013
-6,799
102,57
34.31
5,0
36
dan berikut adalah sebaran data gempa bumi beserta peta sebarannya berdasarkan
Tabel 4.1:
Gambar 4.1 Sebaran Data Gempa Bumi dengan Magnitudo ≥5 SK
pada Kedalaman ≤60 Km Tahun 2008-2013
Gambar 4.2 Peta Sebaran Gempa Bumi dengan Magnitudo ≥5 Skala Richter
pada Kedalaman ≤60 Km Tahun 2008-2013
Pada Gambar 4.1 terlihat bahwa terjadinya peristiwa gempa bumi dengan
magnitudo berskala richter besar, lebih sering diikuti dengan semakin rapatnya
37
frekuensi gempa bumi yang terjadi dalam periode yang berdekatan. Serta pada
Gambar 4.2 terlihat bahwa, peristiwa gempa bumi pada wilayah yang diteliti
paling sering terjadi di wilayah barat Pulau Sumatra dan begitu pula di bagian
selatan Pulau Jawa. Hal ini disebabkan kedua wilayah tersebut dilewati oleh
lempengan tektonik Samudera Hindia yang mengakibatkan berpotensi besar
sering terjadinya gempa bumi.
4.2 Pengecekan Overdispersi Data
Pengecekan overdispersi dilakukan pada data banyaknya gempa bumi
dalam periode 15 hari. Cara yang dilakukan adalah menghitung banyaknya
kejadian gempa bumi pada Tabel 4.1. dalam periode 15 hari, kemudian
membandingakan nilai rata-rata dan variansi dari data tersebut. Jika nilai variansi
banyaknya gempa bumi dalam periode 15 hari lebih besar dari pada nilai rataratanya maka terjadi overdispersi terhadap data tersebut. Diperoleh data
banyaknya gempa bumi dalam periode 15 hari sebanyak 141 data, yang disajikan
pada Tabel 4.2 dan untuk sebaran datanya ditunjukkan pada Gambar 4.2.
Tabel 4.2 Banyaknya Peristiwa Gempa Bumi di Propinsi Sumatra Barat sampai
Propinsi Nusa Tenggara Timur dengan Magnitudo ≥5 Skala Richter pada
Kedalaman ≤60 Km Periode 15 Hari Tahun 2008-2013
15 Hari
Ke1
2
3
Banyaknya
Gempa ≥5 SK
3
2
1
...
...
139
140
141
0
1
2
38
Gambar 4.3 Sebaran Banyaknya Peristiwa Gempa Bumi di Propinsi Sumatra
Barat sampai Propinsi Nusa Tenggara Timur dengan Magnitudo ≥5 Skala
Richter pada Kedalaman ≤60 Km Periode 15 Hari Tahun 2008-2013
Dari proses pengambilan data banyaknya gempa bumi pada Tabel 4.2,
karakteristik pengambilan datanya mengikuti pengambilan data yang berdistribusi
Poisson. Tahap selanjutnya adalah tahap pengecekan overdispersi data banyaknya
gempa bumi terhadap distribusi Poisson. Berikut adalah statistik deskriptif
berdasarkan data pada Tabel 4.2:
Tabel 4.3 Statistik Deskriptif Banyaknya Gempa Bumi di Propinsi Sumatra Barat
sampai Propinsi Nusa Tenggara Timur Periode 15 Hari Tahun 2008-2013
๐
๐ฅ
s2
141
2,035461
4,148733
Maksimum Minimum
14
0
Dari Tabel 4.3 terilihat bahwa nilai s2 ≈ 4,15 > ๐ฅ ≈ 2,036. Sehingga, data
banyaknya gempa bumi pada Tabel 4.2 terjadi overdispersi terhadap distribusi
Poisson. Oleh karena itu, untuk analisis selanjutnya dapat digunakan PHMMs.
4.3 Pemodelan Banyaknya Gempa Bumi dengan PHMMs (Poisson Hidden
Markov Models)
Pada penelitian ini akan dicari model estimasi banyaknya gempa bumi
terbaik dari tiga model. Tiga model tersebut adalah model dengan keadaan
39
tersembunyi, yaitu ๐ = (2,3,4). Penulis hanya memodelkan hingga keadaan
tersembunyi ๐ = 4 dikarenakan data tidak memadai untuk keadaan tersembunyi
๐ ≥ 5. Metode yang digunakan adalah metode PHMMs (Poisson Hidden Markov
Models) dengan estimasi Algoritma EM (Expectation Maximisation Algorithm).
Berikut ini adalah langkah-langkah yang dilakukan beserta hasil pengolahannya
untuk mendapatkan ketiga model estimasi banyaknya gempa bumi tersebut serta
penentuan model yang terbaik.
A. Penentuan Parameter Input
Pada tahap ini adalah menghitung nilai ๐ = ๐1 , … , ๐๐ , yaitu parameter
rata-rata banyaknya gempa bumi per-15 hari, dengan peluang awal kejadiannya
๐
 = (๐ฟ1 , … , ๐ฟ๐ ) dan matriks peluang transisi keadaan tersembunyi ๐ช berukuran
๐ × ๐. Langkah awal dalam mencari parameter-parameter tersebut adalah
membuat tabel distribusi frekuensi dari data banyaknya gempa bumi (Tabel 4.2),
dengan jumlah kelas pada tabel distribusi frekuensi tersebut ditentukan oleh
banyaknya keadaan tersembunyi yang diberikan. Pada peneliti ini, peneliti
mengambil nilai range 0 sampai 11 banyaknya gempa bumi untuk pembagian
interval masing-masing kelas secara seragam. Sebagai contoh model dengan
๐ =2, misalkan jika diberikan 2 keadaan tersembunyi dengan rata-rata banyaknya
gempa bumi ๐ = ๐1 , ๐2 , maka terdapat 2 kelas dengan panjang interval masingmasing kelasnya:
๐=
range
banyaknya kelas
=
12
2
=6
40
Berdasarkan nilai ๐ di atas, ruang sampel banyaknya gempa bumi yang ada pada
keadaan tersembunyi 1 adalah {0,1,2,3,4,5} dan sisanya masuk pada keadaan
tersembunyi 2. Langkah selanjutnya adalah memasukkan data pada Tabel 4.2 ke
masing-masing kelompok keadaan tersembunyi berdasarkan ruang sampelnya,
sehingga diperoleh nilai parameter ๐ = λ1 , λ2 . Parameter ๐
 = (๐ฟ1 , ๐ฟ2 ), yaitu
peluang awal pada keadaan tersembunyi 1 dan keadaan tersembunyi 2, diperoleh
dengan menghitung jumlah frekuensi pada masing-masing kelompok keadaan
tersembunyi dan kemudian frekuensi dari masing-masing kelompok tersebut
dibagi dengan frekuensi keseluruhan keadaan tersembunyi. Hasil perhitungan
parameter ๐ dan ๐
 untuk kasus 2 keadaan tersembunyi disajikan pada Tabel 4.4
berikut:
1
1
1
1
1
2
3
-
2
-
1
-
4
-
2
-
-
6
1
3
2
2
3
1
4
4
5
2
6
6
......
KEADAAN
TERSEMBUNYI
......
BANYAKNYA
GEMPA ≥ 5 SK
139
0
140
1
141
2
๐
๐
๐
1
1
1
141
......
BANYAKNYA GEMPA
KEADAAN
TERSEMBUNYI 2
15 HARI
KE-
......
BANYAKNYA GEMPA
KEADAAN
TERSEMBUNYI 1
......
Tabel 4.4 Hasil Perhitunggan Parameter ๐ dan Parameter ๐น
pada 2 Keadaan Tersembunyi
0
-
1
-
2
-
133
1,699248
133/141 = 0,943262
8
7,625
133/8 = 0,056738
Berdasarkan Tabel 4.4, diperoleh nilai ๐ = (1,699248 , 7,625) dan nilai
๐
 = (0,943262 , 0,056738). Artinya, dalam periode waktu 15 hari, keadaan
41
tersembunyi 1 memiliki nilai rata-rata banyaknya gempa sebesar 1,699248
kejadian dengan peluang awal kejadiannya sebesar 0,943262 dan 7,625 adalah
rata-rata kejadian pada keadaan tersembunyi 2 dengan peluang awal sebesar
0,056738.
Nilai parameter ๐ช, yaitu matriks peluang transisi keadaan tersembunyi,
dimana elemen-elemen pada matriks tersebut diperoleh dengan cara menghitung
frekuensi pada masing-masing kemungkinan perpindahan keadaan tersembunyi
yang kemudian dibagi dengan jumlah total masing-masing baris keadaan
tersembunyi. Pada kasus 2 keadaan tersembunyi, terdapat empat kemungkinan
perpindahan keadaan tersembunyi yang ditunjukkan pada Tabel 4.5 berikut:
Tabel 4.5 Peluang pada 2 Keadaan Tersembunyi
๐๐
1
2
1
2
125/132
7/8
7/132
1/8
sehingga diperoleh matriks peluang transisi pada 2 keadaan tersembunyi sebagai
berikut:
๐ช =
1
2
1
0,94697
0,05303
2
0,875
0,125
Berdasarkan matriks peluang transisi di atas dapat diartikan, jika periode ini
berada pada keadaan tersembunyi 1, maka peluang 15 hari yang akan datang
berada pada keadaan tersembunyi 1 adalah 0,946970. Jika periode ini berada pada
42
keadaan tersembunyi 1, maka peluang 15 hari yang akan datang berada pada
keadaan tersembunyi 2 adalah 0,05303 dan seterusnya.
Proses perhitungan parameter ๐, ๐
, dan ๐ช, dimana diberikan keadaaan
tersembunyi ๐ = 3 dan ๐ = 4 dilakukan dengan cara yang sama. Berikut adalah
tabel lengkap hasil dari proses perhitungan parameter ๐, ๐
, dan ๐ช dengan
keadaaan tersembunyi ๐ = (2,3,4), serta Gambar 4.4 yang merupakan hasil dari
pengelompokan masing-masing keadaan tersembunyi:
Tabel 4.6 Parameter Input ๐, ๐น, dan ๐ pada masing-masing PHMM
Model
๐
๐
๐
๐=2
1
2
1,699248
7,625
๐ =3
1
2
3
๐ =4
1
2
3
4
๐ช
1
2
3
4
0,943262
0,056738
0,94697
0,875
0,05303
0,125
-
-
1,336207
4,73913
11,5
0,822695
0,163121
0,014184
0,826087
0,826087
0,5
0,156522
0,173913
0,5
0,017391
0
0
-
0,924731
3,5
0,659575
0,283688
0,68478
0,625
0,26087
0,325
0,03261
0,05
0,02174
0
6,333333
11,5
0,042553
0,014184
0,66667
0,5
0,33333
0
0
0,5
0
0
Gambar 4.4a Hasil Pengelompokan Data Banyaknya Gempa Bumi
pada 2 Keadaan Tersembunyi
43
Gambar 4.4b Hasil Pengelompokan Data Banyaknya Gempa Bumi
pada 3 Keadaan Tersembunyi
Gambar 4.4c Hasil Pengelompokan Data Banyaknya Gempa Bumi
pada 4 Keadaan Tersembunyi
B. Penaksiran Parameter-parameter PHMMs dengan Algorima EM
Pada bagian ini adalah menghitung nilai estimasi parameter ๐, ๐
 dan ๐ช
untuk masing-masing model dengan menggunakan algoritma EM (Expectation
Maximisation Algorithm). Setelah diperoleh hasil estimasi parameter, langkah
selanjutnya adalah membandingkan nilai AIC (Akaike Information Criterion)
dimana nilai AIC yang terkecil adalah model estimasi banyaknya gempa bumi
terbaik. Perhitungan estimasi algorima EM dikerjakan dengan menggunakan
software R versi 2.12.0 dengan nilai toleransi sebesar 1๐ − 06. Berikut adalah
hasil output estimasi parameter dengan Algoritma EM pada masing-masing
keadaan tersembunyi:
44
Tabel 4.7 Parameter Estimasi Algoritma EM pada masing-masing PHMM
Model
๐
−๐
AIC
๐=2
5
268,7069
547,4138
๐=3
11
๐=4
19
257,7146
255,53
537,4292
549,060
๐
๐
๐
1
1,611815
2
๐ช
1
2
3
4
1
0,905652
0,094348
-
-
5,597163
0
0,786729
0,213271
-
-
1
0,852232
0
0,831224
0,145735
0,023041
-
2
2,844612
1
0,152336
0,847664
0
-
3
12,31558
0
0
1
0
-
1
0,861266
0
0,854086
0,1294405
0
0,016474
2
2,257127
1
0,060919
0,3065668
0,632514
0
3
3,802863
0
0,240358
0,7596419
0
0
4
13,75019
0
0
0
1
0
Berdasarkan Tabel 4.7, yaitu hasil estimasi dengan menggunakan
Algoritma EM pada PHMMs, terlihat bahwa nilai AIC terkecil berada pada saat
diberikan 3 keadaaan tersembunyi yaitu sebesar 537,429. Sehingga dapat
dikatakan bahwa model dengan 3 keadaaan tersembunyi merupakan model terbaik
dari pada model dengan ๐ = 2 dan ๐ = 3. Hal tersebut dikarenakan pada model
๐ = 3, memiliki selisih antara nilai ๐ dengan nilai ๐ yang lebih besar dari pada
model dengan ๐ = 2 dan ๐ = 4, yang mengakibatkan nilai AIC kecil. Berikut
adalah hasil estimasi parameter dari model terbaik PHMM, yaitu model dengan 3
keadaan tersembunyi:
๐ = 0,8522318, 2,844612, 12,3155828 ;
๐
 = 0,1,0 ;
๐ช=
0,8312241 0,1457353 0,02304062
;
0,152336
0,847664
0
0
1
0
dengan nilai ekpektasi dan varansi PHMM:
45
3
E ๐๐ก =
๐ฟ๐ ๐๐
๐=1
= ๐ฟ1 ๐1 + ๐ฟ2 ๐2 + ๐ฟ3 ๐3
= (0×0,8522318) + (1×2,844612) + (0×12,3155828)
= 2,8446121
Var ๐๐ก = E ๐๐ก = 2,8446121
Sehingga dapat disimpulkan bahwa dari ketiga model estimasi banyaknya
gempa bumi di sepanjang Propinsi Sumatra Barat sampai Propinsi Nusa Tenggara
Timur, model dengan 3 keadaan tersembunyi merupakan model estimasi
banyaknya gempa bumi terbaik dengan nilai estimasi parameter rata-rata
banyaknya gempa bumi yang terjadi sebanyak 2,8446121 ≈ 3 peristiwa dalam
kurun waktu 15 hari.
46
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Kesimpulan yang dapat diambil berdasarkan hasil dan pembahasan
sebelumnya adalah sebagai berikut:
1. Model penentuan rata-rata banyaknya gempa bumi dapat menggunakan
metode PHMM (Poisson Hidden Markov Model) dengan estimasi Algoritma
EM (Expectation Maximisation Algorithm).
2. Model terbaik banyaknya gempa bumi pada penelitian ini adalah model
dengan 3 keadaaan tersembumyi dengan nilai estimasi parameter rata-rata
banyaknya gempa adalah 2,8446121 peristiwa dalam kurun waktu 15 hari.
5.2 Saran
Dalam penelitian ini, peneliti hanya melakukan analisis penentuan
mendapatkan model banyaknya gempa bumi terbaik berdasarkan kriteria
pengujian. Oleh sebab itu, penulis mempunyai saran untuk peneliti lain yang juga
tertarik dengan materi ini:
1. Pada penelitian selanjutnya, estimasi parameter banyaknya gempa bumi
terbaik dapat dilakukan dengan mempertimbangkan pembagian lokasi
pengamatan berdasarkan sebaran gempa bumi yang paling sering terjadi.
2. Penelitian ini dapat dilanjutkan kembali untuk memprediksi banyaknya gempa
bumi pada periode berikutnya.
47
DAFTAR PUSTAKA
[1] Walpole, Ronald E. 1993, Pengantar Statistika, Edisi ketiga, Jakarta: Gramedia
Pustaka Utama
[2] Herrhyanto Nar, Gantini Tuti, 2009, Pengantar Statistika Matematis, Bandung:
Yrama Widya.
[3] J. Supranto, 2009, Statistik Teori dan Aplikasi, Edisi ketujuh Jilid 2, Jakarta:
Erlangga.
[4] Nurhayati, Nunung, Teori Peluang (PAM 2231)-Unsoed.
[5] Zucchini, Walter dan Iain L, MacDonald, 2009, Hidden Markov Models for Time
Series, London: CRC Press.
[6] Hillier, F. S., dan Lieberman, G. J. 2008, Introduction to Operation Research, 8th
Edition Jilid 2, Yogyakarta: Andi.
[7] R. Rabiner, Lawrence, A Tutorial on
Hidden Markov Models and Selected
Applications in Speech Recognition, IEEE, Vol. 77, No. 2, Februari, 1989.
[8] Taylor Howard, Karlin Samuel, 1984, An Introduction to Stochastic Modeling,
London: Academic press.
[9] Agusta, Yudi, Mixture Modelling Menggunakan Prinsip Minimum Message
Length, Jurnal Sistem dan Informatika Vol. 1 (Agustus 2005), 1-16, Denpasar:
STIKOM Bali.
48
[10] Zonasi Gempa bumi di Indonesia, http://www.academia.edu/4517794/Zonasi_Gempa_bumi_di_Indonesia, [1/8/2014 08.57 WIB].
[11] Daftar gempa bumi di Indonesia, http://id.wikipedia.org/wiki/Daftar_gempa_bumi_di_Indonesia, [5/8/2014 08.45 WIB].
[12] Gempa Bumi, http://id.wikipedia.org/wiki/Gempa_bumi, [4/7/2014 10.45 WIB].
49
Data Gempa Bumi
di Propinsi Sumatra Barat sampai Propinsi Nusa Tenggara Timur
dengan Magnitudo ≥5 Skala Richter
pada Kedalaman ≤60 Km Tahun 2008-2013
Date
Magnitudo
(SR)
16-03-2008
31-03-2008
02-04-2008
03-04-2008
22-04-2008
27-04-2008
27-04-2008
01-05-2008
03-05-2008
03-05-2008
18-05-2008
20-05-2008
21-05-2008
21-05-2008
21-05-2008
23-05-2008
18-06-2008
20-06-2008
24-06-2008
07-07-2008
09-07-2008
11-07-2008
12-07-2008
20-07-2008
24-07-2008
08-08-2008
08-08-2008
08-08-2008
20-08-2008
22-08-2008
26-08-2008
5,40
5,20
6,10
5,00
5,30
5,40
5,50
5,40
5,70
5,10
6,00
6,10
5,30
5,70
5,40
5,00
5,00
5,30
5,50
5,10
5,60
6,10
5,00
5,90
5,00
6,00
5,70
5,00
5,20
5,20
6,60
29-08-2008
31-08-2008
08-09-2008
5,10
5,00
5,40
โฎ
โฎ
22-11-2011
27-11-2011
29-11-2011
16-12-2011
19-12-2011
22-12-2011
22-12-2011
30-12-2011
05-01-2012
24-02-2012
28-03-2012
06-04-2012
06-04-2012
30-04-2012
27-05-2012
04-06-2012
19-06-2012
07-07-2012
03-09-2012
04-09-2012
04-09-2012
04-09-2012
11-09-2012
13-09-2012
13-09-2012
14-09-2012
15-09-2012
15-09-2012
18-09-2012
5,20
5,40
5,30
5,20
5,00
5,10
5,00
5,30
5,10
5,00
5,20
5,50
5,10
5,00
5,20
5,90
5,10
5,00
6,10
5,00
5,20
5,20
5,30
5,10
5,40
6,20
5,70
5,30
5,20
50
09-11-2012
10-11-2012
21-11-2012
22-11-2012
25-12-2012
30-12-2012
31-01-2013
02-02-2013
06-02-2013
13-02-2013
25-03-2013
05-04-2013
08-04-2013
16-04-2013
16-04-2013
06-05-2013
30-05-2013
03-06-2013
11-06-2013
13-06-2013
22-06-2013
06-07-2013
09-07-2013
09-07-2013
18-07-2013
24-07-2013
14-08-2013
22-08-2013
23-09-2013
11-10-2013
14-10-2013
28-11-2013
10-12-2013
16-12-2013
5,30
5,10
5,40
5,20
5,10
5,00
5,00
5,00
5,30
5,30
5,20
5,00
5,60
5,20
5,00
5,10
5,30
5,10
5,10
5,40
5,10
6,00
5,60
5,10
5,00
5,20
5,00
5,10
5,20
5,30
5,00
5,10
5,30
5,00
51
Banyaknya Peristiwa Gempa Bumi
di Propinsi Sumatra Barat sampai Propinsi Nusa Tenggara Timur
dengan Magnitudo ≥5 Skala Richter pada Kedalaman ≤60 Km
Periode 15 Hari Tahun 2008-2013
15
HARI
KE-
BANYAKNYA
GEMPA
≥ 5SK
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
3
2
1
4
2
6
0
3
4
2
3
4
4
1
3
5
1
5
2
2
6
2
0
0
0
1
1
1
0
0
3
32
33
34
35
36
37
38
39
40
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
3
0
3
3
1
9
2
6
4
2
3
1
2
1
3
1
2
4
1
4
2
0
0
1
0
0
3
0
1
0
2
1
1
0
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
0
0
4
7
0
0
0
4
0
0
2
0
2
2
0
0
2
3
1
0
2
2
1
4
1
1
1
0
1
2
0
0
1
2
52
Kode Komputasi Software R untuk Peluang Forward dan Backward pada PHMM.
pois.HMM.lalphabeta <- function(x,m,lambda,gamma,delta=NULL)
{
if(is.null(delta))delta <- solve(t(diag(m)-gamma+1),rep(1,m))
n
<- length(x)
lalpha
<- lbeta<-matrix(NA,m,n)
allprobs <- outer(x,lambda,dpois)
foo
<- delta*allprobs[1,]
sumfoo <- sum(foo)
lscale
<- log(sumfoo)
foo
<- foo/sumfoo
lalpha[,1] <- log(foo)+lscale
for (i in 2:n)
{
foo
<- foo%*%gamma*allprobs[i,]
sumfoo
<- sum(foo)
lscale
<- lscale+log(sumfoo)
foo
<- foo/sumfoo
lalpha[,i] <- log(foo)+lscale
}
lbeta[,n] <- rep(0,m)
foo
<- rep(1/m,m)
lscale
<- log(m)
for (i in (n-1):1)
{
foo
<- gamma%*%(allprobs[i+1,]*foo)
lbeta[,i]
<- log(foo)+lscale
sumfoo
<- sum(foo)
foo
<- foo/sumfoo
lscale
<- lscale+log(sumfoo)
}
list(la=lalpha,lb=lbeta)
}
53
Kode Komputasi Software R untuk Estimasi EM pada PHMM.
pois.HMM.EM <- function(x,m,lambda,gamma,delta,maxiter=1000,tol=1e-6,...)
{
n
<- length(x)
lambda.next <- lambda
gamma.next <- gamma
delta.next
<- delta
for (iter in 1:maxiter)
{
lallprobs
<- outer(x,lambda,dpois,log=TRUE)
fb
<- pois.HMM.lalphabeta(x,m,lambda,gamma,delta=delta)
la
<- fb$la
lb
<- fb$lb
c
<- max(la[,n])
llk
<- c+log(sum(exp(la[,n]-c)))
for (j in 1:m)
{
for (k in 1:m)
{
gamma.next[j,k] <- gamma[j,k]*sum(exp(la[j,1:(n-1)]
+lallprobs[2:n,k]+lb[k,2:n]-llk))
}
lambda.next[j] <- sum(exp(la[j,]+lb[j,]-llk)*x)/sum(exp(la[j,]+lb[j,]-llk))
}
gamma.next <- gamma.next/apply(gamma.next,1,sum)
delta.next
<- exp(la[,1]+lb[,1]-llk)
delta.next
<- delta.next/sum(delta.next)
crit
<- sum(abs(lambda-lambda.next)) +
sum(abs(gamma-gamma.next)) +
sum(abs(delta-delta.next))
if(crit<tol)
{
np
<- m*m+m-1
AIC
<- -2*(llk-np)
return(list(lambda=lambda,gamma=gamma,delta=delta,mllk=-llk,AIC=AIC))
}
lambda
<- lambda.next
gamma
<- gamma.next
delta
<- delta.next
}
}
54
MODEL 2 STATE ALGORITMA EM
Iterasi
๐ธ๐๐
๐ธ๐๐
๐๐
๐๐
๐น๐
−๐
1
2
30
50
100
500
750
1000
0,05224961
0,05429220
0,08365144
0,08919704
0,09333757
0,09434776
0,09434777
0,09434777
0,8657903
0,8548018
0,8061127
0,7965288
0,7887221
0,7867287
0,7867287
0,7867287
1,731595
1,726842
1,640528
1,625604
1,614518
1,611815
1,611815
1,611815
7,099168
6,928970
5,871929
5,725293
5,621742
5,597163
5,597163
5,597163
0,98671385
0,99603296
1
1
1
1
1
1
269,25270
268,97910
268,71590
268,70880
268,70700
268,70690
268,70690
268,70690
Konvergen
0,09434777
0,7867287
1,611815
5,597163
1
268,70690
55
MODEL 3 STATE ALGORITMA EM
๐ธ๐๐
๐ธ๐๐
๐ธ๐๐
Iterasi
๐ธ๐๐
1
2
30
50
100
500
750
1000
0,1599348
0,1618725
0,1519598
0,1460954
0,1457358
0,1457353
0,1457353
0,1457353
0,01206616
0,01100507
0,02309635
0,02304903
0,02304063
0,02304062
0,02304062
0,02304062
0,8145327
0,80069415
0,15926120
0,15249610
0,15233620
0,15233600
0,15233600
0,15233600
Konvergen
0,1457353
0,02304062
0,152336
๐ธ๐๐
๐ธ๐๐
0
0
0
0
0
0
0
0
0,1982348
0,06828712
0
0
0
0
0
0
0,8017652
0,9317129
1
1
1
1
1
1
0
0
1
๐น๐
−๐
MODEL 3 STATE ALGORITMA EM
๐๐
๐๐
๐น๐
Iterasi
๐๐
1
2
30
50
100
500
750
1000
1,4429880
1,4607280
0,8523790
0,8515037
0,8522308
0,8522318
0,8522318
0,8522318
4,2916670
4,1488420
2,8533920
2,8443633
2,8446117
2,8446121
2,8446121
2,8446121
12,165311
12,7771740
12,2878520
12,3163394
12,3155839
12,3155828
12,3155828
12,3155828
0,770955014
0,68873699
0
0
0
0
0
0
0,228785052
0,31126097
1
1
1
1
1
1
266,9192
265,0246
257,7232
257,7146
257,7146
257,7146
257,7146
257,7146
Konvergen
0,8522318
2,8446121
12,3155828
0
1
257,7146
56
MODEL 4 STATE ALGORITMA EM
๐ธ๐๐
๐ธ๐๐
๐ธ๐๐
Iterasi
๐ธ๐๐
1
2
30
50
100
500
750
1000
1500
2000
0,2845207
0,2837699
0,1548558
0,1460763
0,1396978
0,1295602
0,1294455
0,1294405
0,1294403
0,1294403
0,02411115
0,02088013
0,00000119
0
0
0
0
0
0
0
0,01433387
0,01347044
0,01747817
0,01722440
0,01699953
0,01647856
0,01647393
0,01647373
0,01647372
0,01647372
Konvergen
0,1294403
0
0,01647372
๐ธ๐๐
๐ธ๐๐
0,56246940
0,52169900
0,11956610
0,11024430
0,10075460
0,06141822
0,06094021
0,06091941
0,06091846
0,06091846
0,04379472
0,04394784
0,09171166
0,11694570
0,17113420
0,63201140
0,63249300
0,63251380
0,63251480
0,63251480
0
0
0
0
0
0
0
0
0
0
0,06091846
0,63251480
0
๐ธ๐๐
๐ธ๐๐
MODEL 4 STATE ALGORITMA EM
๐ธ๐๐
๐ธ๐๐
๐ธ๐๐
Iterasi
๐ธ๐๐
1
2
30
50
100
500
750
1000
1500
2000
0,58797890
0,52423990
0,25324450
0,27441180
0,27265320
0,23972794
0,24033186
0,24035812
0,24035932
0,24035932
0,4120211
0,4757601
0,7467555
0,7255882
0,7273468
0,7602721
0,7596681
0,7596419
0,7596407
0,7596407
0
0
0
0
0
0
0
0
0
0
0,1747956
0,0480094
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0,82520444
0,95199060
1
1
1
1
1
1
1
1
Konvergen
0,24035932
0,7596407
0
0
0
1
57
MODEL 4 STATE ALGORITMA EM
Iterasi
๐๐
๐๐
๐๐
๐๐
๐น๐
1
2
30
50
100
500
750
1000
1500
2000
1,0668800
1,0885540
0,7959117
0,8136253
0,8293037
0,8609924
0,8612545
0,8612659
0,8612664
0,8612664
3,2461260
3,1354070
2,5150618
2,4884172
2,4385864
2,2568877
2,2571168
2,2571267
2,2571272
2,2571272
5,3857540
5,1396950
5,3842984
5,1595332
4,7956545
3,8030547
3,8028711
3,8028632
3,8028628
3,8028628
12,5653080 0,345648072 0,620369282 0,03375290
13,2102780 0,1454705
0,82953450 0,02499426
13,8249372
0
1
0,00000001
13,8284619
0
1
0
13,8341688
0
1
0
13,7504940
0
1
0
13,7501980
0
1
0
13,7501852
0
1
0
13,7501846
0
1
0
13,7501846
0
1
0
266,9108
262,5749
255,9739
255,9359
255,8944
255,5300
255,5300
255,5300
255,5300
255,5300
Konvergen
0,8612664
2,2571272
3,8028628
13,7501846
255,5300
0
๐น๐
1
๐น๐
0
−๐
58