6 BAB II TINJAUAN PUSTAKA Bab ini membahas teori

advertisement
BAB II
TINJAUAN PUSTAKA
Bab ini membahas teori-teori dasar yang digunakan sebagai landasan
pembahasan pada bab selanjutnya. Pembahasan teori meliputi pengertian data
secara umum dan data sirkular, ukuran pemusatan dan penyebaran data, regresi
sirkular, regresi nonparametrik, dan regresi nonparametrik sirkular-linear
berganda.
2.1 Data
Data adalah nilai numerik hasil dari sebuah pengamatan (observation)
yang dalam penelitian diasumsikan sebagai variabel (Kitchens, 1998). Data diolah
oleh peneliti dan kemudian diinterpretasikan sehingga dapat dimengerti oleh
orang lain yang tidak secara langsung melakukan pengamatan atau pengumpulan
fakta dari sebuah kejadian.
2.1.2 Ukuran Pemusatan Data
Ukuran pemusatan data memberikan informasi tentang titik-titik di mana
data pengamatan terpusat atau terkumpul dan dapat juga menjadi ciri khas dari
kumpulan data pengamatan (Kitchens, 1998).
A. Nilai tengah (mean)
Jika
adalah anggota suatu populasi terhingga berukuran
nilai tengah populasinya adalah
6
,
7
∑
.
Sedangkan, jika
(2.1)
adalah sampel berukuran
, maka nilai tengah
sampelnya adalah
Μ…
∑
(2.2)
B. Median
Median memiliki sifat membagi dua sama banyak kumpulan data yang
telah diurutkan sebelumnya. Jika banyak data ganjil, maka median adalah data
yang tepat berada di tengah yaitu pada amatan
. Sedangkan, jika banyak
data genap, maka median berada di antara dua data yang berada di tengah yaitu
rata-rata dari pengamatan
dan pengamatan
.
C. Modus
Modus adalah suatu nilai amatan yang paling sering muncul dalam
melakukan penelitian. Nilai modus dalam penelitian mungkin saja akan lebih dari
satu. Penyajian data dalam bentuk grafik akan mempermudah dalam menentukan
nilai modus dari kumpulan data.
2.1.3 Ukuran Penyebaran Data
Ukuran penyebaran data merupakan suatu informasi yang diperoleh dalam
penelitian yang memberikan penjelasan seberapa jauh data-data yang diperoleh
menyebar dari titik pemusatannya (Kitchens, 1998). Ukuran penyebaran data yang
paling sering digunakan adalah ragam. Ragam (variance) memberikan informasi
8
rata-rata jarak kuadrat semua titik pengamatan terhadap titik pusat atau rataan.
Jika
adalah anggota suatu populasi terhingga berukuran
, maka
ragam populasinya adalah
∑
(2.3)
Sedangkan, jika
adalah anggota suatu sampel berukuran
, maka
ragam sampelnya adalah
∑
Μ…
(2.4)
2.2 Data dan Statistika Sirkular
Data sirkular adalah data yang nilai-nilainya berulang secara periodik
dengan responnya bukan skalar tetapi angular atau berarah sehingga dikategorikan
sebagai data berarah (Jammalamadaka dan SenGupta, 2001). Pengukuran data
sirkular biasanya dalam satuan derajat
dari 0 radian sampai
sampai
atau dalam satuan radian
radian.
Dua alat yang sering digunakan untuk membantu dalam pemilihan arah
pada proses pengukuran data sirkular adalah kompas dan jam. Dalam melakukan
pengukuran, arah utara pada kompas dan pukul 00.00 pada jam biasanya disebut
arah
atau 0 radian. Arah migrasi hewan, arah terbang burung, atau arah angin
dihitung dengan bantuan kompas. Waktu kejadian kasus kecelakaan, waktu
kejadian kasus kriminal, waktu datangnya pasien dalam 24 jam di sebuah rumah
sakit dihitung dalam jam.
9
Berbeda dengan data pada umumnya yang hanya memiliki satu dimensi
pengukuran, data sirkular memiliki dua dimensi pengukuran yaitu jika
pengamatan
nilai
digambarkan pada koordinat kartesius dapat dinyatakan sebagai
atau pada koordinat polar dapat dinyatakan sebagai nilai
sebagai jarak titik
dari titik pusat
dengan
pada sudut .
y
P
r
πœƒ
x
Gambar 2.1 Hubungan Koordinat Kartesius dengan Koordinat Polar
(Nurhab, 2014)
Pada Gambar 2.1. perubahan koordinat polar menjadi koordinat kartesius dapat
menggunakan persamaan trigonometri berikut
dan
.
(2.5)
Perbedaan lainnya dengan data pada umumnya adalah data sirkular tidak
memiliki nilai minimum dan maksimum karena data awal sama dengan data akhir
yaitu
radian sama dengan
radian. Nilai pengamatan pada sudut
akan
memiliki nilai yang sama dengan pengamatan yang terletak pada sudut
untuk
bilangan bulat positif, karena dalam analisis sirkular yang diperhatikan
adalah arah bukan besaran vektor yaitu setiap titik pengamatan pada keliling
lingkaran menyatakan sebuah arah. Pada Gambar 2.1, sebuah pengamatan
menyatakan arah yang dibuat vektor terhadap sumbu
positif atau
menyatakan arah yang dibuat vektor terhadap sumbu
kartesius amatan tersebut adalah
positif. Koordinat
dan koordinat polarnya
10
adalah
. Karena yang diperhatikan adalah arah, maka jarak
dari titik pusat
dibuat sama dengan 1
setiap amatan
. Sehingga diambil vektor-vektor
tersebut menjadi vektor unit yaitu vektor dengan panjang satuan
.
Representasi data sirkular dalam arah yang dipengaruhi sudut tentu tidak
selalu unik yaitu nilai angularnya bergantung pada pemilihan arah acuan
dan
arah rotasi apakah searah dengan arah perputaran jarum jam (clockwise) atau
berlawanan arah perputaran jarum jam (counter-clockwise) (Jammalamadaka dan
SenGupta, 2001). Pemilihan arah utara sebagai arah acuan
mengakibatkan arah
perputaran positif yaitu searah dengan arah perputaran jarum jam, sedangkan
pemilihan arah timur sebagai arah acuan
mengakibatkan arah perputaran
positif yaitu berlawanan arah perputaran jarum jam. Pada Gambar 2.2, arah
adalah
jika arah acuannya adalah arah utara dan arah rotasinya searah
perputaran jarum jam, atau
jika arah acuannya adalah arah timur dan arah
rotasinya berlawanan arah perputaran jarum jam.
Utara
r
P
Timur
Gambar 2.2. Arah Acuan dan Arah Rotasi Pengamatan
Dalam analisis regresi sirkular-linear, perbedaan pemilihan arah acuan
tidak memengaruhi koefisien determinasi dan statistik lima serangkai yaitu
11
statistik minimum, kuartil bawah, median, kuartil atas, dan statistik maksimum
dari sisaannya, tetapi memengaruhi hasil dugaan parameter persamaan regresi
sirkular-linear. Sedangkan perbedaan pemilihan arah rotasi tidak berpengaruh
terhadap persamaan regresi sirkular-linear yang dibentuk (Nurussadad, 2011).
Representasi data sirkular dalam bentuk grafis menjadi hal yang sangat
penting dan bentuknya tentu akan berbeda dengan representasi grafis data pada
umumnya. Bentuk grafis yang biasa digunakan dalam analisis data sirkular adalah
(a)
(b)
(c)
Gambar 2.3. Diagram Pancar (a), Histogram Siklik (b), dan Diagram Mawar (c)
(Nurhab, 2014)
2.2.1 Ukuran Pemusatan Data Sirkular
Mengalisis data sirkular menggunakan dua fungsi trigonometri yaitu
fungsi sinus
dan fungsi cosinus . Sehingga cara menghitung ukuran pemusatan
dan ukuran penyebaran data sirkular akan berbeda dengan cara menghitung
ukuran pemusatan dan ukuran penyebaran pada umumnya.
A. Arah rata-rata sirkular
Menurut Jammalamadaka dan SenGupta (2001), menentukan arah ratarata data sirkular menggunakan metode yang digunakan pada statistika linear
dapat menghasilkan arah rata-rata yang tidak sesuai dengan pusat dari data
12
pengamatan yang diperoleh. Sebagai contoh penelitian tentang arah migrasi
burung. Misalkan dua burung terbang ke arah
dan ke arah
dan dipilih
arah acuan nol derajat yaitu arah utara dan arah rotasi searah dengan arah
perputaran jarum jam seperti yang ditunjukkan pada gambar berikut:
Gambar 2.4. Arah Rata-rata Sirkular dengan Statistika Linear untuk Dua Buah
Pengamatan.
Pada Gambar 2.4, dengan menggunakan statistika linear diperoleh arah
rata-rata yaitu
yang menuju ke arah selatan, meskipun arah terbang kedua
burung tersebut lebih terkonsentrasi ke arah utara. Jika dimisalkan lagi terdapat
empat burung yang bermigrasi masing-masing ke arah
, dan
dengan arah acuan dan arah rotasi yang sama, maka dengan statistika linear
diperoleh arah rata-rata yaitu
yang menuju ke arah selatan seperti yang
ditunjukkan pada gambar berikut:
Gambar 2.5. Arah Rata-rata Sirkular dengan Statistika Linear untuk Empat Buah
Pengamatan.
13
Pada Gambar 2.5, dengan menggunakan statistika linear diperoleh arah
rata-rata yaitu
yang menuju ke arah selatan meskipun data semakin
terkonsentrasi ke arah utara. Berdasarkan contoh tersebut, dapat ditunjukkan
bahwa metode yang digunakan untuk mencari nilai rata-rata statistika linear tidak
cukup baik untuk diterapkan pada data sirkular. Keragaman data sampel
yang
sangat bergantung pada nilai rata-rata tentu juga akan sangat dipengaruhi nilainya.
Menentukan arah rata-rata untuk data sirkular dilakukan dengan
memperlakukan data sirkular dalam vektor unit dan menggunakan arah dari
vektor resultannya (Jammalamadaka dan SenGupta, 2001). Arah rata-rata sirkular
Μ… diperoleh dari
Μ…
Μ…
dengan
dengan
,
(2.6)
,
(2.7)
adalah fungsi cosinus dan fungsi sinus yang diperoleh dari
∑
(2.8)
∑
(2.9)
adalah pengamatan ke- dan panjang vektor resultan
β€– β€–
√
.
diperoleh dari
(2.10)
14
Vektor resultan
dari
vektor unit diperoleh dengan menjumlahkan
semua komponen arahnya
.
(2.11)
Balikan kuadran tertentu (invers quadrant-specific) tangen dari arah ratarata sirkular Μ… diberikan untuk segala kemungkinan nilai fungsi
( )
Μ…
Jika 𝐢𝑛 >
dan 𝑆𝑛 ≥
Jika 𝐢𝑛
dan 𝑆𝑛 >
( )
Jika 𝐢𝑛 <
( )
Jika 𝐢𝑛 ≥
dan 𝑆𝑛 <
Jika 𝐢𝑛
dan 𝑆𝑛
{
dan
yaitu
(2.12)
B. Median data sirkular
Mardia (1972) dalam Otieno (2002) menyatakan bahwa median sampel Μƒ
dari data sampel sirkular
adalah titik
pada keliling lingkaran yang
memiliki sifat :
1. Diameter
dengan
adalah anti-median membagi lingkaran menjadi
dua bagian, yang setiap bagiannya memiliki jumlah pengamatan sama
banyak.
2.
Sebagian besar data pengamatan berada disekitar titik
titik .
dibandingkan di
15
Gambar 2.6. Median Sirkular untuk Data Genap dan Data Ganjil
(Otieno, 2002)
Jika banyak data
adalah genap, maka median sampel sirkular berada di
antara dua pengamatan yang berdekatan dengan . Sedangkan jika banyak data
adalah ganjil, maka median sampel sirkular adalah sebuah titik data pengamatan.
Proses menentukan median pada data sirkular tidak bisa disamakan dengan proses
penentuan median pada data linear yaitu prosedur pengurutan data dari data
amatan terkecil sampai data amatan terbesar tidak bisa diterapkan pada penentuan
median data sirkular (Otieno, 2002). Sebagai contoh, penelitian terhadap arah
terbang tujuh ekor burung yaitu ke arah
,
,
,
,
,
, dan
seperti yang ditunjukkan pada gambar berikut:
𝑃
𝑃
𝑄
Gambar 2.7. Median Sirkular
dan Median Linear
Pada Gambar 2.7., dengan memilih arah acuan nol derajat yaitu arah utara, arah
rotasi searah dengan arah perputaran jarum jam dan dengan menggunakan
prosedur yang diperkenalkan Mardia (1972) dalam Otieno (2002) diperoleh
16
median sirkular pada arah
. Sedangkan, jika digunakan prosedur pengurutan
data yang digunakan pada data linear, maka diperoleh median sirkular pada arah
. Tentu saja
tidak sama dengan
. Shepherd dan Fisher (1982) dalam
Otieno (2002) mengemukakan bahwa bantuan grafik akan sangat membantu
menentukan median sirkular.
C. Modus data sirkular
Modus data sirkular akan mudah ditentukan dengan bantuan grafik. Nilai
modus akan muncul pada data yang terkonsentrasi di keliling lingkaran pada
sudut atau arah tertentu. Seperti data pada umumnya, data sirkular mungkin saja
memiliki nilai modus lebih dari satu.
2.2.2 Ukuran Penyebaran Data Sirkular
Mardia (1976) dalam Nurhab (2014) mendefinisikan ragam sampel
sirkular sebagai
Μ…
dengan
(2.13)
adalah panjang vektor resultan dan Μ… adalah panjang rata-rata dari
vektor resultan dengan
Μ…
. Nilai ragam yang semakin kecil menandakan
data semakin terkonsentrasi menuju suatu titik tertentu.
2.3 Regresi Sirkular
Variabel dalam suatu regresi terdiri dari variabel prediktor (independent
variable) dan variabel respons (dependent variable). Menganalisis data sirkular
17
dengan analisis regresi jika dilihat dari jenis variabelnya akan membentuk tiga
jenis model regresi sirkular yaitu (Scoot, 2002):
1. Regresi Sirkular–Linear (circular-linear regression)
Regresi sirkular–linear yaitu analisis regresi dengan variabel prediktor
sirkular dan variabel responnya linear. Regresi sirkular–linear merupakan analisis
regresi sirkular yang paling sering digunakan. Menurut SenGupta dan Ugwuowo
(2006) model regresi sirkular linear antara variabel respons linear
prediktor sirkular
dan variabel
adalah
(2.14)
dengan
dan
adalah parameter yang belum diketahui nilainya,
sebuah acrophase, dan
adalah komponen galat acak. Sedangkan,
adalah
adalah
frekuensi angular (angular frequency) yaitu
(2.15)
atau
(2.16)
dengan
adalah periode.
2. Regresi Sirkular-Sirkular (circular-circular regression)
Regresi sirkular-sirkular yaitu analisis regresi dengan variabel prediktor
dan variabel respons sama-sama merupakan data sirkular.
18
3. Regresi Linear-Sirkular (linear-circular regression)
Regresi linear-sirkular yaitu analisis regresi dengan variabel prediktor
linear dan variabel respons sirkular.
2.4 Regresi Nonparametrik
Statistika nonparametrik adalah statistika bebas sebaran yang digunakan
dengan mengabaikan asumsi-asumsi yang harus dipenuhi pada statistika
parametrik. Statistika nonparametrik disebut juga statistika bebas distribusi.
Bentuk kurva dalam regresi nonparametrik tidak diketahui dan diasumsikan
termuat dalam suatu ruang fungsi berdimensi tak hingga dan merupakan fungsi
yang mulus (smooth).
Dalam statistika nonparametrik bentuk kurva yang kurang mulus dapat
dipermulus (smoothing) dengan menggunakan teknik smoothing tertentu. Tujuan
dari smoothing adalah membuang variabilitas dari data yang tidak memiliki efekefek sehingga ciri-ciri dari data tampak lebih jelas. Salah satu teknik smoothing
yang umum digunakan adalah estimator kernel
pada pemanfaatannya
dilakukan pada setiap titik data (Sukarsa dan Srinadi, 2012).
2.4.1 Kernel Standar
Estimator kernel merupakan pengembangan dari estimator histogram.
Menurut Wand dan Jones (1995) bentuk fungsi kernel
( ), untuk
<
<
>
secara umum yaitu
(2.17)
19
dengan
adalah parameter pemulus (smoother) yang disebut bandwidth. Fungsi
kernel memiliki beberapa sifat yaitu:
≥
1.
untuk semua
(2.18)
2. ∫
(2.19)
>
3. ∫
(2.20)
4. ∫
(2.21)
5.
, untuk semua
(sifat simetris)
(2.22)
Beberapa jenis fungsi kernel yang umum digunakan yaitu
| |
1. Kernel Uniform :
| |
2. Kernel Segitiga :
(2.23)
| |
(2.24)
| |
3. Kernel Epanechnikov :
| |
4. Kernel Kuartik :
(
6. Kernel Cosinus :
dengan
√
(
(2.27)
) | |
)
adalah fungsi indikator untuk suatu himpunan
{
(2.26)
| |
5. Kernel Triweight :
7. Kernel Gaussian :
(2.25)
(2.28)
<
<
(2.29)
yaitu
(2.30)
20
2.4.2 Kernel Sirkular
Kernel sirkular untuk orde
[
adalah fungsi
(i)
⁄
(ii)
apabila
representasi
deret
Fourier
konvergen
ke
}
∫
nyatakan
untuk
(iii)
,
∑
{
>
yang memiliki sifat (Marzio et al., 2009):
[
untuk
dan parameter pemulus (smoothing)
kemudian
< < , dan
,
;
naik, maka ∫
menuju 1 untuk
Kernel von Mises adalah kernel sirkular orde kedua (second-order circular
kernel) yang memiliki bentuk
[
dengan
]
(2.31)
adalah variabel prediktor sirkular,
(concentration parameter), dan
[
∫
adalah parameter konsentrasi
adalah fungsi Bessel termodifikasi orde nol,
]
.
(2.32)
Sebaran von Mises adalah sebaran normal sirkular yang paling umum
digunakan karena memiliki langkah kerja yang sama dengan sebaran normal pada
data linear. Sebaran von Mises pertama kali diperkenalkan oleh von Mises pada
tahun 1981 dengan sebaran
[
],
<
<
(2.33)
21
dengan
adalah variabel prediktor sirkular,
adalah arah rata-rata sirkular,
adalah parameter konsentrasi (concentration parameter), dan
adalah fungsi
Bessel termodifikasi orde nol,
∫
Jika
[
sama dengan nol, maka
]
.
=
dan akan mengikuti sebaran seragam
(2.34)
(uniform) yang tanpa memperhatikan arah.
Sama seperti sebaran normal, metode yang digunakan untuk mengevaluasi
sebaran von Mises adalah QQ-plot. Menurut Fisher (1993) dalam Nurhab (2014),
jika sebaran data mengikuti sebaran von Mises maka plot data mengikuti garis
lurus
dengan kemiringan
. Proses evaluasi dengan von Mises yaitu
dimulai dengan mencari
Μ‚ untuk
(2.35)
kemudian diurutkan dari nilai terkecil sampai terbesar
Langkah selanjutnya yaitu membuat plot (
(
)
)
.
(
(
)
)
(Fisher dalam Nurhab, 2014).
2.5 Bandwidth
Parameter bandwidth disebut juga parameter pemulusan (smoothing) yang
memiliki peran seperti lebar interval pada histogram. Parameter bandwidth akan
mengontrol kemulusan kurva regresi yang diestimasi. Pemilihan bandwidth yang
terlalu kecil akan menghasilkan kurva yang sangat kasar, dan sebaliknya
22
pemilihan bandwidth yang terlalu besar akan menghasilkan kurva yang terlalu
mulus yang akibatnya akan tidak sesuai dengan pola data yang sebenarnya
(Hardle, 1994). Oleh karena itu, diperlukan suatu metode untuk memilih
bandwidth yang optimal. Metode yang dapat digunakan yaitu metode CrossValidation (CV) yang didefinisikan sebagai berikut
∑
dengan
Μ‚
Μ‚
(2.36)
adalah penduga leave-one-out dengan menghilangkan
.
Pemilihan bandwidth yang optimal dilakukan dengan memilih nilai awal
untuk meminimumkan persamaan (2.36) Langkah-langkah
pemilihan bandwidth yang optimal berdasarkan kriteria CV minimum yaitu:
Langkah 1. Untuk
, tentukan nilai
dan minimumkan persamaan (2.36)
sehingga diperoleh vektor parameter smoothing
dengan
Langkah 2. Untuk
dan nilai CV,
.
, ulangi langkah 1 sampai menemukan kriteria yang
sesuai sehingga dihasilkan rangkaian(series) nilai CV.
Langkah 3. Pilih nilai CV terkecil dari rangkaian nilai
dihasilkan sehingga diperoleh nilai bandwidth optimal yaitu
yang
.
2.6 Regresi Nonparametrik Sirkular-Linear Berganda
SengGupta dan Ugwuowo (2006) memperkenalkan bentuk umum model
regresi sirkular–linear berganda antara sebuah variabel respons linear dengan
variabel prediktor linear dan variabel prediktor sirkular. Bentuk modelnya adalah
23
∑
dengan
(2.37)
adalah variabel respons linear,
koefisien regresi,
adalah variabel prediktor linear,
adalah frekuensi angular,
periode ,
adalah nilai rataan,
adalah
adalah amplitudo,
adalah variabel prediktor sirkular yang menentukan
adalah acrophase dan
adalah komponen galat acak. Pendugaan
dinyatakan dalam satuan radian atau derajat arah,
(2.38)
atau
.
Kemudian
(2.39)
Qin
(2011)
mengasumsikan
bentuk
model
regresi
nonparametrik sirkular-linear berganda dengan bentuk
(2.40)
dengan
adalah variabel respons skalar,
(
) ,
dimensi sirkular
dan
, serta
adalah fungsi regresi,
masing-masing adalah dimensi linear
dan
adalah variabel acak berdistribusi IID (Independent
and
Identically Distributed) dengan rataan nol dan ragam unit dan bebas dari
Misalkan
adalah vektor variabel respons,
.
24
[
]
(2.41)
sebagai desain matriks, dan
(2.42)
sebagai bobot matriks, dengan
bersama
dan
√
dengan
adalah sampel acak dari fungsi densitas peluang
∏
adalah fungsi linear–sirkular
(
adalah kernel linear standar dan
) ∏
(
) (2.43)
adalah kernel sirkular orde
kedua. Penduga kernel kuadrat terkecil linear lokal dari
diperoleh dari
masukan pertama dari vektor
Μ‚
( Μ‚)
∑
(
)
.
(2.44)
Dengan demikian penduga kernel kuadrat terkecil linear lokal dari
adalah
Μ‚
(
)
(2.45)
25
dengan
adalah vektor berukuran (
dengan nilai 1 pada
masukan pertama dan yang lainnya 0.
Vektor dari nilai yang diduga (fitted values) Μ‚
Μ‚
Μ‚
adalah
Μ‚
(
)
.
(2.46)
Download