PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI PENDUGAAN SELANG KEPERCAYAAN RATA-RATA POPULASI DENGAN KONDISI ADANYA PENCILAN Skripsi Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Sains Program Studi Matematika Oleh : Petronela Yuni Iswari NIM: 133114001 PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2017 i PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI ON THE ESTIMATION OF POPULATION MEAN CONFIDENCE INTERVAL IN THE PRESENCE OF OUTLIERS A Thesis Presented as a Partial Fulfillment of the Requirements to Obtain the Degree of Sarjana Sains Mathematics Study Program Written by : Petronela Yuni Iswari Student Number: 133114001 MATHEMATICS STUDY PROGRAM DEPARTMENT OF MATHEMATICS FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2017 ii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI iii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI iv PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI HALAMAN PERSEMBAHAN Skripsi ini dipersembahkan untuk: Tuhan Yesus Kristus dan Bunda Maria yang senantiasa menyertai, memberikan berkat-Nya, dan memberi perlindungan sepanjang perjalanan hidup saya. Kedua orangtua, Bapak Hendricus Bagyo dan Ibu Margaretta Istikomah, S.Pd, serta kakak Heribertus Henta Nooristyanto, S.T yang selalu mendokan, memberi kasih sayang, serta menjadi penyemangat dalam hidup saya. “Aku tahu, bahwa Engkau sanggup melakukan segala sesuatu, dan tidak ada rencana-Mu yang gagal.” (Ayub 42:2) “Banyaklah rancangan di hati manusia, tetapi keputusan Tuhanlah yang terlaksana.” (Amsal 19:21) v PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI vi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI ABSTRAK Pencilan adalah nilai ekstrim yang muncul di dalam suatu analisis data. Adanya pencilan dapat mengakibatkan bias kesimpulan atas hasil analisis. Untuk mendeteksi pencilan digunakan metode grafis, Boxplot, Uji Grubbs, dan Uji MAD. Penulisan skripsi ini bertujuan untuk menduga selang kepercayaan rata-rata populasi dengan kondisi adanya pencilan. Untuk menyimpulkan hasil analisis pada data yang memuat pencilan digunakan statistik robust (kekar) yang menghasilkan kesimpulan data tetap akurat meskipun dalam keadaan yang tidak ideal. Statistik robust yang digunakan adalah penduga median (Fraiman, et al) dan penduga 𝑀 (penduga Huber). Dalam skripsi ini digunakan empat metode selang kepercayaan, yaitu metode selang kepercayaan dengan penduga rata-rata, median (Kendall and Stuart), median (Fraiman, et al), dan penduga Huber. Selang kepercayaan robust dengan simulasi data acak diperoleh dari distribusi Normal, Cauchy, dan ChiSquare dengan ukuran 𝑛 = 10, 50, 100, dan 500 untuk setiap distribusi. Hasil simulasi menunjukkan bahwa selang kepercayaan robust bagi parameter lokasi dengan penduga median (Fraiman, et al) dan penduga Huber adalah selang kepercayaan robust yang insensitif terhadap adanya pencilan. Hal ini disebabkan karena hasil dari standard error (galat standar) dan lebar selang kepercayaan yang tetap, meskipun nilai pencilan semakin besar untuk setiap ukuran sampel yang diberikan. Kata Kunci: Pencilan, Pendeteksian Pencilan, Statistik Robust, Penduga Robust, Selang Kepercayaan Robust. vii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI ABSTRACT An outlier is an extreme value which is appeared in data analysis. The presence of outliers will affect to the bias conclusion of analytical results. Graphical method, Boxplot, Grubbs Test, and MAD Test can be applied to detect the presence of outliers. The purpose of this thesis is to estimate the population mean confidence interval in the presence of outliers. To summarize the results of the analysis on the data contains the outliers, robust statistics is used so that the result in the conclusion of the data remains accurate although it is not ideal. Robust statistics for location parameters which were used are median estimators (Fraiman, et al) and M estimators (Huber estimators). We apply four confidence interval methods that are confidence interval method for mean estimators, median estimators (Kendall and Stuart), median estimators (Fraiman, et al), and Huber estimators. Robust confidence interval with random data simulation was obtained from Normal, Cauchy, and Chi-Square distributions of sample sizes 𝑛 = 10, 50, 100, and 500 for each distributions. From the simulation, robust confidence interval for location parameters with the median estimators (Fraiman, et al) and Huber estimators were insensitive robust confidence interval to the presence of outliers while two others were sensitive. It is due to the value of the standard error and the width of the confidence interval which remains constant although the value of the outlier becomes bigger for each sample size. Keywords: Outlier, Detection of Outlier, Robust Statistics, Robust Estimators, Robust Confidence Intervals. viii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI ix PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI KATA PENGANTAR Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus yang selalu mencurahkan rahmat dan Roh KudusNya sehingga penulis mampu mengerjakan dan menyelesaikan skripsi ini dengan baik. Skripsi ini dibuat dengan tujuan memenuhi salah satu syarat dalam menyelesaikan studi Strata satu (S1) dan memperoleh gelar Sarjana Sains (S.Si.) pada Program Studi Matematika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma Yogyakarta. Penulis menyadari bahwa proses penulisan skripsi ini melibatkan banyak pihak untuk membantu dalam menghadapi berbagai macam tantangan, kesulitan dan hambatan selama proses penulisan skripsi. Oleh karena itu, pada kesempatan ini penulis mengucapkan terima kasih kepada: 1. Bapak Ir. Ig. Aris Dwiatmoko, M.Sc., selaku dosen pembimbing skripsi yang telah meluangkan waktu, tenaga, dan pikiran, serta dengan penuh kesabaran telah memberikan masukan, nasihat dan arahan kepada penulis. 2. Bapak Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D., selaku Dekan Fakultas Sains dan Teknologi. 3. Bapak YG. Hartono, S.Si., M.Sc., Ph.D., selaku Kaprodi Matematika. 4. Ibu M. V. Any Herawati, S.Si., M.Si., selaku Wakaprodi Matematika dan Dosen Pembimbing Akademik angkatan 2013. 5. Romo Prof. Dr. Frans Susilo, S.J., Bapak Dr. rer. nat. Herry P. Suryawan, S.Si., M.Si., Bapak Ir. Ig. Aris Dwiatmoko, M.Sc., Bapak Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D., Bapak YG. Hartono, S.Si., M.Sc., Ph.D., Ibu M. V. Any Herawati, S.Si., M.Si., dan Ibu Lusia Krismiyati Budiasih, S.Si., M.Si., selaku dosen Prodi Matematika yang telah memberikan banyak pengetahuan dan pengalaman kepada penulis selama proses perkuliahan. 6. Perpustakaan Universitas Sanata Dharma dan Bapak/Ibu dosen/karyawan Fakultas Sains dan Teknologi yang telah banyak membantu selama penulis berkuliah. x PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI xi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DAFTAR ISI HALAMAN JUDUL...........................................................................................i HALAMAN JUDUL DALAM BAHASA INGGRIS ........................................ii HALAMAN PERSETUJUAN PEMBIMBING .................................................iii HALAMAN PENGESAHAN .............................................................................iv HALAMAN PERSEMBAHAN .........................................................................v PERNYATAAN KEASLIAN KARYA .............................................................vi ABSTRAK ..........................................................................................................vii ABSTRACK .......................................................................................................viii LEMBAR PERNYATAAN PERSETUJUAN ...................................................ix KATA PENGANTAR ........................................................................................x DAFTAR ISI .......................................................................................................xii DAFTAR TABEL ...............................................................................................xvi DAFTAR GAMBAR ..........................................................................................xvii BAB I PENDAHULUAN ...................................................................................1 A. Latar Belakang....................................................................................1 B. Rumusan Masalah ..............................................................................2 C. Pembatasan Masalah...........................................................................3 D. Tujuan Penulisan ................................................................................3 E. Manfaat Penulisan ..............................................................................4 F. Metode Penulisan ...............................................................................4 G. Sistematika Penulisan .........................................................................4 BAB II PENDUGAAN PARAMETER ..............................................................6 A. Statistika .............................................................................................6 B. Distribusi Probabilitas ........................................................................11 1. Variabel Acak ..............................................................................11 2. Fungsi Probabilitas bagi Variabel Acak .......................................12 3. Fungsi Distribusi Kumulatif .........................................................14 4. Karakteristik Distribusi Probabilitas ............................................14 xii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI C. Distribusi Sampling ............................................................................30 1. Teorema Limit Pusat ....................................................................30 2. Distribusi 𝑡 ....................................................................................32 D. Pendugaan Parameter .........................................................................33 1. Pendugaan (Estimasi) ...................................................................33 2. Macam-macam Pendugaan Parameter..........................................34 E. Konsistensi Penduga ...........................................................................45 F. Metode Kemungkinan Maksimum .....................................................47 G. Pencilan ..............................................................................................51 1. Definisi Pencilan ..........................................................................51 2. Pengaruh Pencilan ........................................................................55 3. Pendeteksian Pencilan ..................................................................56 BAB III SELANG KEPERCAYAAN ROBUST ................................................69 A. Statistik Robust ...................................................................................69 B. Pengujian Robustness .........................................................................70 C. Penduga 𝑀 (Penduga Huber) .............................................................75 D. MAD (Median Absolute Deviation) ...................................................79 E. Selang Kepercayaan Robust bagi Parameter Lokasi ..........................82 BAB IV SELANG KEPERCAYAAN ROBUST DENGAN SIMULASI DATA ACAK ...................................................................................................85 BAB V PENUTUP ..............................................................................................89 A. Kesimpulan .........................................................................................89 B. Saran ...................................................................................................90 DAFTAR PUSTAKA .........................................................................................92 LAMPIRAN ........................................................................................................94 xiii PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DAFTAR TABEL Tabel 2.1 Fungsi probabilitas banyaknya laptop yang rusak ............................... 13 Tabel 2.2 Nilai harapan dan galat standar beberapa penduga titik ....................... 38 Tabel 2.3 Banyaknya barang yang terjual dan harga barang................................ 52 Tabel 2.4 Produksi hasil hutan rimba (kayu pertukangan) menurut jenisnya di provinsi D. I. Yogyakarta ................................................................... 53 Tabel 2.5 Jumlah wisatawan yang masuk melalui pintu Makassar ...................... 56 Tabel 2.6 Durasi (dalam menit) periode aktif dari Geyser Old Faithful ............. 61 Tabel 2.7 Ketebalan lapisan oksida bagi silicon wafers ....................................... 63 Tabel 2.8 Data Boiler ........................................................................................... 66 xiv PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DAFTAR GAMBAR Gambar 2.1 Fungsi probabilitas Normal ............................................................. 24 Gambar 2.2 Distribusi nilai dugaan ..................................................................... 35 Gambar 2.3 Distribusi sampling untuk penduga titik bias positif ....................... 35 Gambar 2.4 Fungsi probabilitas bagi 𝑈 ............................................................... 42 Gambar 2.5 Letak −𝑧𝛼⁄2 dan 𝑧𝛼⁄2 ...................................................................... 44 Gambar 2.6 Harga barang terhadap banyaknya barang yang terjual ................... 53 Gambar 2.7 Produksi hasil hutan rimba terhadap waktu ..................................... 54 Gambar 2.8 Scatter-plot jumlah wisman dan pengunjung asing ......................... 57 Gambar 2.9 Anatomi dari Boxplot ....................................................................... 60 Gambar 2.10 Boxplot contoh 2.29 ....................................................................... 61 Gambar 2.11 Perbandingan boxplot untuk data ketebalan lapisan oksida .......... 64 Gambar 3.1 Kurva sensitivitas untuk rata-rata .................................................... 72 Gambar 3.2 Kurva sensitivitas untuk median...................................................... 73 Gambar 3.3 Kurva sensitivitas untuk median contoh 3.4 .................................... 74 Gambar 3.4 (a) Fungsi tujuan, 𝜌(𝑥; 𝑡) = (𝑥 − 𝑡)2 ............................................. 76 (b) Fungsi 𝜓, 𝜓(𝑥; 𝑡) = 𝑥 − 𝑡.......................................................... 77 Gambar 3.5 Pendugaan dengan fungsi tujuan mutlak residual. (a) Fungsi tujuan, 𝜌(𝑥; 𝑡) = |𝑥 − 𝑡|; (b) Fungsi 𝜓, 𝜓(𝑥; 𝑡) = sgn(𝑥 − 𝑡) .................. 79 Gambar 3.6 Hasil pendeteksian uji MAD ........................................................... 80 Gambar 3.7 (a) Kurva sensitivitas untuk MAD .................................................. 81 (b) Kurva sensitivitas untuk standar deviasi .................................... 82 xv PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB I PENDAHULUAN A. Latar Belakang Masalah Pendugaan sering muncul di lingkungan sekitar dalam kehidupan sehari- hari yang tidak dapat dihindari. Permasalahan yang sering terjadi adalah bagaimana dugaan tersebut dapat mendekati kebenaran. Terdapat dua jenis pendugaan, yaitu pendugaan titik dan pendugaan selang. Pendugaan titik adalah penentuan suatu nilai tunggal berdasarkan atas sampel yang dengan baik menduga parameter sasaran, sedangkan pendugaan selang adalah penentuan batas-batas selang nilai, yang disebut batas atas (𝜃𝑈 ) dan batas bawah (𝜃𝐿 ). Batas-batas itu dihitung berdasarkan pengukuran sampel dan hasilnya mempunyai peluang tertentu yang memuat parameter sasaran (Wackerly, et al, 2008: 391). Peluang tersebut disebut tingkat kepercayaan. Tingkat kepercayaan itu sering dinyatakan dengan persen (%) dan memuat parameter tertentu (𝜃) yang disebut koefisien kepercayaan. Selang yang dihasilkan dengan tingkat kepercayaan tertentu disebut selang kepercayaan. Bentuk selang kepercayaan yang sering digunakan adalah 𝑷(𝜃̂𝐿 < 𝜃 < 𝜃̂𝑈 ) = 1 − 𝛼, 0 < 𝛼 < 1, dengan 1 − 𝛼 adalah koefisien kepercayaan dan 𝜃̂𝐿 < 𝜃 < 𝜃̂𝑈 adalah selang kepercayaan. Pada umumnya bentuk selang kepercayaan (1 − 𝛼)100% bagi 𝜇 adalah 𝜎 𝜎 𝑥̅ − 𝑧𝛼⁄2 ∙ < 𝜇 < 𝑥̅ + 𝑧𝛼⁄2 ∙ √𝑛 √𝑛 dengan 𝜎 adalah standar deviasi populasi yang diketahui dan 𝑧𝛼⁄2 adalah kuartil ke (𝛼 ⁄2) dari distribusi Normal standar 𝑍 dengan 𝑛 ≥ 30 menurut Teorema Limit Pusat. Suatu pendugaan yang dilakukan tidak tertutup kemungkinan akan terjadi kesalahan (error). Kondisi tersebut kerap kali dipengaruhi oleh adanya pencilan (outlier) yang dapat mengganggu proses analisis data, sehingga pendeteksian pencilan sangat penting untuk dilakukan. Pencilan (outlier) 1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 2 adalah data yang memiliki perbedaan cukup ekstrim bila dibandingkan dengan data lainnya (Barnett, 1978: v). Pengaruh pencilan pada proses analisis data, salah satunya adalah terhadap nilai rata-rata dan standar deviasi. Adanya pencilan dapat menunjukkan kesalahan pengukuran dalam distribusi data, serta dapat menyebabkan variansi data menjadi besar, selang data menjadi lebar, dan rata-rata tidak dapat menunjukkan nilai yang sebenarnya (bias). Oleh karena itu, akan lebih baik jika pencilan dihapuskan supaya tidak ada kejanggalan dalam analisis data, tetapi diupayakan terlebih dahulu untuk menyelidiki penyebab adanya pencilan. Di sisi lain, adakalanya pencilan tidak dapat dihapuskan begitu saja karena pencilan dapat memberikan suatu informasi yang tidak dapat diberikan oleh data lainnya. Skripsi ini akan membahas tentang selang kepercayaan yang robust (kekar). Sifat robust (kekar) sendiri memiliki kinerja yang baik dalam menghasilkan pendugaan yang dapat mencapai kebenaran yang memuaskan dengan selang kepercayaan yang cenderung lebih sempit. Kata “robust” (kekar) seringkali muncul di dalam proses analisis data yang menginginkan pencilan tetap ada, namun tidak menyebabkan adanya kejanggalan. Dengan demikian, akan diperoleh selang kepercayaan baru yang menjadikan selang kepercayaan dapat tetap kekar untuk digunakan dalam pendugaan rata-rata populasi. Akan diperkenalkan selang kepercayaan robust bagi parameter lokasi dengan penduga median dan penduga Huber. Selang kepercayaan robust bagi parameter lokasi dengan penduga Median dibedakan menjadi dua berdasarkan galat standar yang diberikan oleh Fraiman, et al (2001) dengan Kendall dan Stuart (2001). B. Rumusan Masalah Perumusan masalah yang akan dibicarakan pada skripsi ini adalah: 1. Bagaimana cara mengetahui data yang mengandung pencilan? 2. Apa pengaruh pencilan dalam pendugaan selang kepercayaan rata-rata populasi? PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 3 3. Bagaimana penduga robust (kekar) dapat membuat selang kepercayaan menjadi lebih baik dengan adanya pencilan? 4. Bagaimana perbandingan selang kepercayaan yang robust dengan selang kepercayaan yang biasa? C. Pembatasan Masalah Penulis akan membatasi penulisan agar menjadi lebih terarah dan tidak menyimpang dari masalah yang akan dibahas, yaitu: 1. Data yang digunakan dalam penulisan hanyalah data yang mengandung pencilan univariat. 2. Metode yang digunakan dalam pengujian sifat robust yang dimiliki oleh suatu penduga hanya dengan menggunakan kurva sensitivitas. 3. Penulis hanya menggunakan dua penduga robust dengan menggunakan penduga median (Fraiman, et al) dan penduga M (Huber) bagi parameter lokasi. 4. Galat standar dan lebar selang yang dihasilkan dari selang kepercayaan bagi suatu penduga akan dibandingkan dengan galat standar dan lebar selang yang dihasilkan dari selang kepercayaan bagi penduga lainnya. D. Tujuan Penulisan Tujuan yang ingin dicapai penulis, selain untuk memenuhi syarat skripsi dalam Program Studi Matematika Universitas Sanata Dharma, juga untuk: 1. Mengetahui penduga robust dalam menduga parameter lokasi untuk data yang memuat pencilan. 2. Mengetahui seberapa robust (kekar) selang kepercayaan yang terbentuk dari suatu data yang memuat pencilan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 4 E. Manfaat Penulisan Manfaat dari penulisan skripsi ini adalah sebagai berikut: 1. Penulis memperoleh pengetahuan baru selama mengerjakan tulisan ini. 2. Pembaca mendapat gambaran tentang pendugaan selang kepercayaan bagi rata-rata populasi dengan kondisi adanya pencilan di dalam suatu data. 3. Skripsi ini dapat dijadikan referensi bagi penganalisis lain. F. Metode Penulisan Metode penulisan yang digunakan penulis dalam penulisan skripsi ini adalah metode studi pustaka, yaitu dengan membaca dan mempelajari bukubuku atau jurnal yang berkaitan dengan pendugaan selang kepercayaan ratarata populasi, pencilan, serta sifat robust (kekar) dari selang kepercayaan. G. Sistematika Penulisan Skripsi ini ditulis menggunakan sistematika berikut: BAB I PENDAHULUAN A. Latar Belakang B. Rumusan Masalah C. Batasan Masalah D. Tujuan Penulisan E. Manfaat Penulisan F. Metode Penulisan G. Sistematika Penulisan BAB II PENDUGAAN PARAMETER A. Statistika B. Distribusi Probabilitas C. Distribusi Sampling D. Pendugaan Parameter E. Konsistensi Penduga F. Metode Kemungkinan Maksimum PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 5 G. Pencilan BAB III SELANG KEPERCAYAAN ROBUST A. Statistik Robust B. Pengujian Robustness C. Penduga M D. MAD (Median Absolute Deviation) E. Selang Kepercayaan yang Robust bagi Parameter Lokasi BAB IV SELANG KEPERCAYAAN ROBUST DENGAN SIMULASI DATA ACAK BAB V PENUTUP A. Kesimpulan B. Saran DAFTAR PUSTAKA PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB II PENDUGAAN PARAMETER A. Statistika Teknik statistik hampir digunakan dalam setiap fase kehidupan banyak orang di berbagai bidang. Contohnya, para ahli ekonomi yang mengamati berbagai indeks kesehatan ekonomi selama periode waktu dan menggunakan informasi tersebut untuk meramalkan kondisi ekonomi di masa depan, serta pelaksanaan survey yang dirancang untuk mengumpulkan data pada hari pemilihan dan meramalkan hasil pemilu. Definisi dari statistika sendiri muncul dari para statistikawan. Stuart dan Ord (1991) menyatakan: "Statistika adalah cabang dari metode ilmiah yang berkaitan dengan data yang diperoleh dengan menghitung atau mengukur sifat dari populasi. Rice (1995) dalam komentarnya mengenai eksperimen dan aplikasi dalam statistika, menyatakan bahwa statistika pada dasarnya berkaitan dengan prosedur untuk menganalisis data, terutama data yang memiliki karakter acak. Freund dan Walpole (1987) menyatakan statistika adalah ilmu yang mendasarkan kesimpulan pada data yang diamati dan seluruh masalah dalam membuat keputusan dalam menghadapi ketidakpastian. Mood, Graybill, dan Boes (1974) mendefinisikan statistika sebagai teknologi dari metode ilmiah dan menambahkan bahwa statistika berkaitan dengan desain eksperimen dan penyelidikan, serta statistika inferensi. Dari beberapa definisi tersebut dapat disimpulkan bahwa statistika adalah sekumpulan metode untuk merencanakan eksperimen, mengumpulkan data, menganalisis, menafsirkan dan mengambil kesimpulan berdasarkan data. Pengambilan sampel dari populasi yang akan diteliti diperlukan untuk mengambil kesimpulan. 6 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 7 Definisi 2.1 Populasi adalah kumpulan yang lengkap dari semua elemen (nilai, orang, benda, hasil, dan lain-lain) yang menjadi pusat perhatian untuk dipelajari dan diteliti. Lengkap berarti mencakup semua obyek yang akan diambil kesimpulannya. Banyaknya observasi dalam populasi didefinisikan sebagai ukuran populasi. Di bidang statistika inferensi, statistik tertarik pada kesimpulan mengenai populasi bila tidak memungkinkan untuk mengamati seluruh pengamatan yang membentuk populasi. Misalnya, dalam upaya untuk menentukan rata-rata hidup dari suatu lampu merk tertentu. Hal ini tidak mungkin untuk menguji semua lampu. Biaya yang terlalu tinggi juga bisa menjadi faktor penghalang dalam mengamati seluruh populasi. Oleh karena itu, pengamatan bergantung pada bagian dari populasi, yang disebut sampel, untuk membantu memperoleh kesimpulan tentang populasi yang diamati berdasarkan informasi yang terdapat di dalam sampel . Definisi 2.2 Sampel adalah himpunan bagian dari populasi yang menjadi perhatian kita. Jika menginginkan kesimpulan yang valid, maka harus didapatkan sampel yang mewakili populasi. Oleh karena itu, diperlukan pemilihan sampel secara acak, yaitu setiap individu dalam populasi mempunyai peluang tertentu untuk dipilih sebagai anggota sampel. Tujuan utama dalam memilih sampel secara acak adalah untuk memperoleh informasi tentang parameter populasi yang tidak diketahui. Definisi 2.3 Parameter adalah karakteristik dari populasi yang biasa dinyatakan dalam suatu nilai/konstanta. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 8 Secara umum, parameter dilambangkan dengan 𝜃. Parameter 𝜃 dapat berupa rata-rata µ, variansi 𝜎 2 dan proporsi 𝑝. Parameter dibagi menjadi dua bagian, yaitu parameter lokasi dan parameter skala yang definisi eksaknya akan dibahas kemudian pada Definisi 2.15 dan Definisi 2.18. Parameter lokasi dirancang untuk memenuhi analisis dengan banyaknya nilai pada data yang berada di pusat. Contohnya adalah rata-rata µ dan median. Sedangkan parameter skala dirancang untuk mengetahui penyebaran data analisis. Contoh dari parameter skala adalah variansi 𝜎 2 dan standar deviasi 𝜎. Definisi 2.4 Statistik adalah fungsi dari variabel-variabel acak yang diamati dalam sampel dan dinyatakan dalam suatu bilangan. Ada beberapa contoh statistik, yaitu rata-rata sampel 𝑥̅ , standar deviasi sampel 𝑠, dan proporsi sampel 𝑝̂ . Parameter 𝜇, 𝜎 2 dan 𝑝 adalah parameter yang nilainya sama sekali tidak terpengaruh atau dipengaruhi oleh pengamatan sampel acak. Statistik yang paling umum digunakan adalah mean (rata-rata), median (nilai tengah) dan modus. Definisi 2.5 Misalkan pengamatan di dalam sampel berukuran 𝑛 adalah 𝑥1 , 𝑥2 , … , 𝑥𝑛 . Rata-rata sampel dilambangkan dengan 𝑥̅ yang didefinisikan sebagai 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑥̅ = = . 𝑛 𝑛 Definisi 2.6 Diberikan pengamatan sampel 𝑥1 , 𝑥2 , … , 𝑥𝑛 . Sampel disusun dari data yang nilainya terkecil hingga data yang nilainya terbesar, maka nilai tengah (median) sampel adalah: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 9 𝑥(𝑛+1)/2 𝑥̃ = {1 (𝑥 + 𝑥𝑛+1 ) 2 𝑛/2 2 , jika 𝑛 bilangan ganjil, , jika 𝑛 bilangan genap, dengan 𝑥(𝑛+1)/2 adalah pengamatan ke- (𝑛 + 1)/2 dari variabel acak 𝑋. Definisi 2.7 Modus sampel adalah nilai dari sampel yang paling sering muncul atau memiliki frekuensi yang paling besar. Ukuran variasi yang lebih umum digunakan dalam statistika adalah variansi yang merupakan fungsi deviasi (atau jarak) ukuran sampel dari rata-ratanya. Definisi 2.8 Variansi dari sampel berukuran 𝑛, diberikan sebagai berikut ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑠 = . 𝑛−1 2 Variansi populasi yang sesuai, dilambangkan dengan 𝜎 2 . Definisi 2.9 Standar deviasi dari sampel berukuran 𝑛 adalah akar kuadrat positif dari variansi yang diberikan sebagai berikut 𝑠 = √𝑠 2 . Standar deviasi populasi yang sesuai, dilambangkan dengan 𝜎 = √𝜎 2 . Contoh 2.1 Dari hasil penelitian mengenai nilai ujian matematika dari 50 mahasiswa diperoleh data sebagai berikut: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 10 42 74 68 54 78 57 83 71 41 89 64 50 76 100 90 74 59 89 98 23 84 64 90 95 33 45 71 87 66 67 57 78 62 38 79 65 87 67 42 74 71 50 34 57 90 69 59 23 74 34 Carilah rata-rata, median, modus, variansi serta standar deviasi dari sampel penelitian tersebut. Solusi: Rata-rata Sampel ∑50 3292 𝑖=1 𝑥𝑖 𝑥̅ = = = 65.8. 50 50 Median Sampel Data penelitian yang sudah urut adalah sebagai berikut: 23 23 33 33 34 38 41 42 42 45 50 50 54 57 57 57 59 59 62 64 64 65 66 67 67 68 69 71 71 71 74 74 74 74 76 78 78 79 83 84 87 87 89 89 90 90 90 95 98 100 sehingga diperoleh, 𝑥̃ = 1 1 (𝑥25 + 𝑥26 ) = (67 + 68) = 67.5. 2 2 Modus Sampel Nilai yang sering muncul dalam pengamatan sampel adalah 74, yaitu sebanyak empat kali. Oleh karena itu, modus sampel dari pengamatan adalah 74. Variansi Sampel 2 ∑50 19080.04 𝑖=1(𝑥𝑖 − 65.8) 𝑠 = = = 389.3886. 49 49 2 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 11 Standar Deviasi Sampel 𝑠 = √389.3886 = 19.73. B. Distribusi Probabilitas 1. Variabel Acak Definisi 2.10 Variabel acak adalah fungsi bernilai bilangan real yang domainnya adalah ruang sampel. Variabel acak dinotasikan dengan huruf kapital dan nilainya dinotasikan dengan huruf kecil. Misalkan 𝑋 menyatakan variabel acak, maka nilai dari 𝑋 adalah 𝑥. Definisi 2.11 Variabel acak 𝑋 dikatakan variabel acak diskrit jika himpunan dari kemungkinan hasilnya adalah terbilang. Jika hal ini tidak terpenuhi, maka variabel acak 𝑋 disebut variabel acak kontinu. Contoh 2.2 Para statistikawan menggunakan perencanaan pengambilan sampel untuk menerima atau menolak sekumpulan barang. Misalnya, salah satu rencana pengambilan sampel yaitu sampel diambil secara acak sebanyak 10 dari 100 barang. Dari 100 barang tersebut terdapat 12 barang yang rusak. Misalkan 𝑋 adalah variabel acak yang didefinisikan sebagai banyaknya barang yang ditemukan rusak dalam sampel dari 10 barang. Dalam hal ini, variabel acak bernilai 0,1,2, . . . ,9,10. Contoh 2.3 Pusat survey melakukan percobaan dengan mengirimkan surat pada para responden dan melihat proporsi responden dalam merespon surat tersebut. Misalkan 𝑋 adalah variabel acak yang didefinisikan sebagai proporsi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 12 responden. 𝑋 akan memuat semua nilai 𝑥 dalam selang 0 ≤ 𝑥 ≤ 1. 2. Fungsi Probabilitas bagi Variabel Acak Fungsi probabilitas dibagi menjadi dua macam, yaitu fungsi probabilitas diskrit dan kontinu. a. Fungsi Probabilitas Diskrit Definisi 2.12 Himpunan pasangan terurut (𝑥, 𝑝(𝑥)) adalah suatu fungsi probabilitas, atau distribusi probabilitas dari suatu variabel acak diskrit 𝑋, jika 1. 0 ≤ 𝑝(𝑥) ≤ 1 untuk setiap 𝑥, 2. ∑𝑥 𝑝(𝑥) = 1, 3. 𝑃(𝑋 = 𝑥) = 𝑝(𝑥). Contoh 2.4 Pengiriman 20 laptop ke toko pengecer berisi 3 yang rusak. Apabila ada sekolah yang membeli laptop secara acak sebanyak 2 laptop, temukanlah distribusi probabilitas untuk banyaknya laptop yang rusak. Solusi: Misalkan 𝑋 adalah variabel acak yang nilainya 𝑥, yaitu kemungkinan banyaknya laptop rusak yang dibeli oleh sekolah. Kemudian 𝑥 hanya dapat berisi nilai 0,1, dan 2, sehingga diperoleh 𝑝(0) = 𝑃(𝑋 = 0) = 𝑝(1) = 𝑃(𝑋 = 1) = 𝑝(2) = 𝑃(𝑋 = 2) = (30)(17 ) 2 (20 ) 2 (31)(17 ) 1 (20 ) 2 (32)(17 ) 0 (20 ) 2 = 136 , 190 = 51 , 190 = 3 . 190 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 13 Tabel 2.1. Fungsi probabilitas banyaknya laptop yang rusak b. 𝑥 0 1 2 𝑝(𝑥) 136 190 51 190 3 190 Fungsi Probabilitas Kontinu Definisi 2.13 Fungsi 𝑓(𝑥) adalah fungsi probabilitas untuk variabel acak kontinu 𝑋, jika 1. 𝑓(𝑥) ≥ 0, untuk setiap 𝑥 ∈ 𝑅, 2. ∫−∞ 𝑓(𝑥)𝑑𝑥 = 1, 3. 𝑃(𝑎 < 𝑋 < 𝑏) = ∫𝑎 𝑓(𝑥)𝑑𝑥. ∞ 𝑏 Contoh 2.5 Misalkan suhu dalam ℃ yang diuji dalam pengontrolan laboratorium adalah suatu variabel acak kontinu 𝑋 yang mempunyai fungsi probabilitas 𝑥2 𝑓(𝑥) = { 3 , 𝑑𝑎𝑛 − 1 < 𝑥 < 2, 0 , lainnya. a) Periksalah bahwa 𝑓(𝑥) adalah fungsi probabilitas. b) Temukan 𝑃(0 < 𝑋 ≤ 1). Solusi: a) Dengan jelas, 𝑓(𝑥) ≥ 0. Untuk memeriksa syarat kedua dalam Definisi 2.13, diperoleh 2 𝑥2 ∞ ∫−∞ 𝑓(𝑥)𝑑𝑥 = ∫−1 b) 1 𝑥2 𝑃(0 < 𝑋 ≤ 1) = ∫0 3 𝑑𝑥 = 3 𝑑𝑥 = 𝑥3 1 | 9 0 𝑥3 | 2 9 −1 1 = 9. = 1. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 14 3. Fungsi Distribusi Kumulatif Definisi 2.14 Fungsi distribusi kumulatif 𝐹(𝑥) dari variabel acak 𝑋 dengan fungsi probabilitas 𝑝(𝑥) adalah ∑ 𝑝(𝑡) , ∀𝑡≤𝑥 𝑥 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = { 4. 𝑑𝑎𝑛jika 𝑋 diskrit ∫ 𝑓(𝑡)𝑑𝑡 , 𝑑𝑎𝑛jika 𝑋 kontinu −∞ Karakteristik Distribusi Probabilitas Distribusi probabilitas suatu variabel acak dicirikan dengan parameter lokasi dan parameter skala. Definisi 2.15 Misalkan 𝑓(𝑥; 𝜃, 𝜆) adalah sembarang fungsi probabilitas suatu variabel acak 𝑋. Parameter 𝜃 adalah parameter lokasi jika fungsi probabilitas dapat ditulis sebagai fungsi dari 𝑥 − 𝜃; yaitu 𝑓(𝑥; 𝜃, 𝜆) = ℎ(𝑥 − 𝜃; 𝜆) untuk setiap fungsi ℎ(∗; 𝜆) yang tidak bergantung pada 𝜃. Contoh 2.6 Diberikan fungsi probabilitas sebagai berikut 𝑓(𝑥; 𝜇, 𝜎) = 1 𝜎√2𝜋 2 𝑒 −(1/2) [(𝑥−𝜇)/𝜎] . Misalkan 𝑦 = 𝑥 − 𝜇, maka fungsi 𝑓(𝑥; 𝜇, 𝜎) dapat ditulis sebagai ℎ(𝑦; 𝜎) = 1 𝜎√2𝜋 2 𝑒 −(1/2) [𝑦/𝜎] . Dengan demikian, 𝜇 adalah parameter lokasi. Contoh 2.7 Jika 𝑋~𝑁(0, 𝜃), maka 𝑋 − 𝜃~𝑁(−𝜃, 𝜃) mempunyai distribusi yang tidak bebas dari 𝜃. Dengan demikian, 𝜃 adalah bukan parameter lokasi. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 15 Definisi 2.16 Misalkan 𝑥1 , 𝑥2 , … , 𝑥𝑛 adalah variabel acak dari suatu distribusi dengan fungsi probabilitas 𝑓(𝑥; 𝜇); 𝜇 ∈ Ω, Ω adalah ruang parameter. Penduga 𝑡(𝑥1 , … , 𝑥𝑛 ) didefinisikan sebagai ekuivarian lokasi jika dan hanya jika 𝑡(𝑥1 + 𝑐, … , 𝑥𝑛 + 𝑐) = 𝑡(𝑥1 , … , 𝑥𝑛 ) + 𝑐, untuk semua nilai 𝑥1 , … , 𝑥𝑛 dan sebuah konstanta 𝑐. Dengan kata lain, penambahan konstanta 𝑐 pada variabel acak akan menambah nilai dugaan sebesar 𝑐. Definisi 2.17 Misalkan 𝑥1 , 𝑥2 , … , 𝑥𝑛 adalah variabel acak dari suatu distribusi dengan fungsi probabilitas 𝑓(𝑥; 𝜇); 𝜇 ∈ Ω, Ω adalah ruang parameter. Penduga 𝑡(𝑥1 , … , 𝑥𝑛 ) didefinisikan sebagai invarian lokasi jika dan hanya jika 𝑡(𝑥1 + 𝑐, … , 𝑥𝑛 + 𝑐) = 𝑡(𝑥1 , … , 𝑥𝑛 ), untuk semua nilai 𝑥1 , … , 𝑥𝑛 dan sebuah konstanta 𝑐. Dengan kata lain, penambahan konstanta 𝑐 pada variabel acak tidak akan mengubah nilai penduga. Contoh 2.8 Apakah 𝑥̅ adalah penduga invarian atau ekuivarian lokasi? Solusi: Misalkan 𝑡(𝑥1 , … , 𝑥𝑛 ) = 𝑥̅ . Kemudian, ∑𝑛𝑖=1(𝑥𝑖 + 𝑐) 𝑛 ∑𝑛𝑖=1 𝑥𝑖 + 𝑛𝑐 = 𝑛 𝑡(𝑥1 + 𝑐, … , 𝑥𝑛 + 𝑐) = = 𝑥̅ + 𝑐 = 𝑡(𝑥1 , … , 𝑥𝑛 ) + 𝑐. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 16 Oleh karena penambahan konstanta 𝑐 pada variabel acak akan menambah nilai dugaan 𝑥̅ sebesar 𝑐, maka 𝑥̅ adalah penduga ekuivarian lokasi dan tidak invarian. Contoh 2.9 Apakah 𝑠 2 adalah penduga invarian atau ekuivarian lokasi? Solusi: 2 𝑛 Misalkan 𝑡(𝑥1 , … , 𝑥𝑛 ) = 𝑠 2 = ∑𝑖=1 𝑥𝑖 ∑𝑛 )) 𝑖=1(𝑥𝑖 −( 𝑛 . 𝑛−1 Kemudian, ∑𝑛𝑖=1 (𝑥𝑖 𝑡(𝑥1 + 𝑐, … , 𝑥𝑛 + 𝑐) = ∑𝑛 𝑥 + 𝑐 + 𝑐 − ( 𝑖=1 𝑛𝑖 )) 𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 + 𝑐 − (𝑥̅ + 𝑐)) = 𝑛−1 = 2 2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑛−1 2 ∑𝑛𝑖=1 (𝑥𝑖 = ∑𝑛 𝑥𝑖 − ( 𝑖=1 𝑛 )) 𝑛−1 = 𝑠2 = 𝑡(𝑥1 , … , 𝑥𝑛 ). Oleh karena penambahan konstanta 𝑐 pada variabel acak tidak mengalami perubahan nilai dugaan 𝑠 2 , maka 𝑠 2 adalah penduga invarian lokasi dan tidak ekuivarian. Definisi 2.18 Misalkan 𝑓(𝑥; 𝜃) adalah sembarang fungsi probabilitas suatu variabel acak 𝑋. Keluarga fungsi probabilitas 𝑓(𝑥/𝜃)⁄𝜃 , untuk 𝜃 > 0, parameter 𝜃 adalah parameter skala bagi 𝑓(𝑥) jika dan hanya jika distribusi dari 𝑥⁄𝜃 tidak bergantung pada 𝜃. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 17 Contoh 2.10 Diberikan fungsi probabilitas sebagai berikut 𝑓(𝑥) = 1 −(𝑥/𝜃) 𝑒 . 𝜃 Misalkan 𝑦 = 𝑥/𝜃, maka keluarga fungsi probabilitas 𝑓(𝑥/𝜃)⁄𝜃 dapat ditulis sebagai 𝑓(𝑦) 1 −(𝑦) = 𝑒 𝜃 𝜃 𝑓(𝑦) = 𝑒 −(𝑦) , untuk 𝑦 > 0 Dengan demikian, 𝜃 adalah parameter skala. Definisi 2.19 Misalkan 𝑥1 , 𝑥2 , … , 𝑥𝑛 adalah variabel acak dari suatu distribusi dengan fungsi probabilitas 𝑓(𝑥; 𝜇); 𝜇 ∈ Ω, Ω adalah ruang parameter. Penduga 𝑡(𝑥1 , … , 𝑥𝑛 ) didefinisikan sebagai ekuivarian skala jika dan hanya jika 𝑡(𝑐𝑥1 , … , 𝑐𝑥𝑛 ) = 𝑐𝑡(𝑥1 , … , 𝑥𝑛 ), untuk semua nilai 𝑥1 , … , 𝑥𝑛 dan sebuah konstanta 𝑐 > 0. Definisi 2.20 Misalkan 𝑥1 , 𝑥2 , … , 𝑥𝑛 adalah variabel acak dari suatu distribusi dengan fungsi probabilitas 𝑓(𝑥; 𝜇); 𝜇 ∈ Ω, Ω adalah ruang parameter. Penduga 𝑡(𝑥1 , … , 𝑥𝑛 ) didefinisikan sebagai invarian skala jika dan hanya jika 𝑡(𝑐𝑥1 , … , 𝑐𝑥𝑛 ) = 𝑡(𝑥1 , … , 𝑥𝑛 ), untuk semua nilai 𝑥1 , … , 𝑥𝑛 dan sebuah konstanta 𝑐 > 0. Dengan kata lain, penduga bersifat invarian terhadap skala jika nilainya tidak mengalami perubahan dengan adanya perkalian dengan 𝑐. Contoh 2.11 Apakah 𝑥̅ adalah penduga invarian atau ekuivarian terhadap skala? PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 18 Solusi: Misalkan 𝑡(𝑥1 , … , 𝑥𝑛 ) = 𝑥̅ . Kemudian, ∑𝑛𝑖=1 𝑐𝑥𝑖 𝑛 𝑐 ∑𝑛𝑖=1 𝑥𝑖 = 𝑛 𝑡(𝑐𝑥1 , … , 𝑐𝑥𝑛 ) = = 𝑐𝑥̅ = 𝑐𝑡(𝑥1 , … , 𝑥𝑛 ). Oleh karena penambahan konstanta 𝑐 pada variabel acak akan mengubah nilai dugaan 𝑥̅ , maka 𝑥̅ adalah penduga ekuivarian terhadap skala dan tidak invarian. a. Nilai Harapan atau Rata-rata dari Variabel Acak Definisi 2.21 Misalkan 𝑋 adalah variabel acak dengan fungsi probabilitas 𝑝(𝑥). Nilai harapan atau rata-rata dari 𝑋 adalah ∑ 𝑥𝑝(𝑥) , 𝑑𝑎𝑛jika 𝑋 diskrit 𝑥 ∞ 𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 , { −∞ 𝑑𝑎𝑛jika 𝑋 kontinu Teorema 2.1 Diberikan 𝑎, 𝑏 suatu konstanta, 𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏. Bukti: Berdasarkan Definisi 2.21, diperoleh: untuk variabel acak diskrit, 𝐸(𝑎𝑋 + 𝑏) = ∑(𝑎𝑥 + 𝑏) 𝑝(𝑥) 𝑥 = ∑(𝑎𝑥 𝑝(𝑥) + 𝑏 𝑝(𝑥)) 𝑥 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 19 = 𝑎 ∑ 𝑥 𝑝(𝑥) + 𝑏 ∑ 𝑝(𝑥) 𝑥 𝑥 = 𝑎𝐸(𝑋) + 𝑏. Untuk variabel acak kontinu, ∞ 𝐸(𝑎𝑋 + 𝑏) = ∫ (𝑎𝑥 + 𝑏)𝑓(𝑥)𝑑𝑥 −∞ ∞ ∞ = 𝑎 ∫ 𝑥𝑓(𝑥)𝑑𝑥 + 𝑏 ∫ 𝑓(𝑥)𝑑𝑥 −∞ −∞ = 𝑎𝐸(𝑋) + 𝑏. ∎ Lemma 2.1 Diberikan 𝑎 = 0, maka 𝐸(𝑏) = 𝑏. Bukti: Untuk variabel acak diskrit, 𝐸(𝑏) = ∑𝑥 𝑏𝑝(𝑥) = 𝑏 ∑𝑥 𝑝(𝑥) = 𝑏(1) = 𝑏 . Untuk variabel acak kontinu, 𝑥𝐸(𝑏) = ∫ 𝑏𝑓(𝑥)𝑑𝑥 = 𝑏 ∫ 𝑓(𝑥)𝑑𝑥 = 𝑏. ∎ Lemma 2.2 Diberikan 𝑏 = 0, maka 𝐸(𝑎𝑋) = 𝑎𝐸(𝑋). Bukti: Untuk variabel acak diskrit, 𝐸(𝑎𝑋) = ∑𝑥 𝑎𝑥𝑝(𝑥) = 𝑎 ∑𝑥 𝑥𝑝(𝑥) = 𝑎𝐸(𝑋). Untuk variabel acak kontinu, 𝐸(𝑎𝑋) = ∫ 𝑎𝑥𝑓(𝑥)𝑑𝑥 = 𝑎 ∫ 𝑥𝑓(𝑥)𝑑𝑥 = 𝑎𝐸(𝑋). ∎ Teorema 2.2 Misalkan 𝑋 adalah variabel acak dengan fungsi probabilitas 𝑝(𝑥) dan 𝑔1 (𝑋), 𝑔2 (𝑋), … , 𝑔𝑘 (𝑋) adalah 𝑘 buah fungsi dari 𝑋; maka 𝐸[𝑔1 (𝑋) + 𝑔2 (𝑋) + ⋯ + 𝑔𝑘 (𝑋)] = 𝐸[𝑔1 (𝑋)] + 𝐸[𝑔2 (𝑋)] + ⋯ + 𝐸[𝑔𝑘 (𝑋)]. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 20 Bukti: Akan dibuktikan dengan 𝑘 = 2, tetapi langkah tetap sama untuk setiap 𝑘. Menurut Definisi 2.21, diperoleh: untuk 𝑋 diskrit, 𝐸[𝑔1 (𝑋) + 𝑔2 (𝑋)] = ∑[𝑔1 (𝑥) + 𝑔2 (𝑥)]𝑝(𝑥) 𝑥 = ∑ 𝑔1 (𝑥)𝑝(𝑥) + ∑ 𝑔2 (𝑥)𝑝(𝑥) 𝑥 𝑥 = 𝐸[𝑔1 (𝑋)] + 𝐸[𝑔2 (𝑋)]. Untuk 𝑋 kontinu, ∞ 𝐸[𝑔1 (𝑋) + 𝑔2 (𝑋)] = ∫ [𝑔1 (𝑥) + 𝑔2 (𝑥)]𝑝(𝑥)𝑑𝑥 −∞ ∞ ∞ = ∫ 𝑔1 (𝑥)𝑓(𝑥)𝑑𝑥 + ∫ 𝑔2 (𝑥)𝑓(𝑥)𝑑𝑥 −∞ −∞ = 𝐸[𝑔1 (𝑥)] + 𝐸[𝑔2 (𝑥)]. b. ∎ Variansi dari Variabel Acak Definisi 2.22 Jika 𝑋 adalah variabel acak dengan rata-rata 𝐸(𝑋) = 𝜇, maka variansi dari 𝑋 didefinisikan sebagai nilai harapan dari (𝑋 − 𝜇)2 , yaitu 𝜎 2 = 𝑉(𝑋) = 𝐸[(𝑋 − 𝜇)2 ] ∑(𝑥 − 𝜇)2 𝑝(𝑥) , 𝑑𝑎𝑛jika 𝑋 diskrit, 𝑥 ∞ = { ∫ (𝑥 − 𝜇)2 𝑓(𝑥)𝑑𝑥 , jika 𝑋 kontinu. −∞ Standar deviasi dari 𝑋 adalah akar dari 𝑉(𝑋). Contoh 2.12 Diberikan 7 komponen sebagai sampel yang terdiri atas 4 komponen tidak rusak dan 3 komponen rusak. Penguji mengambil sampel secara acak PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 21 sebanyak 3 komponen. Temukan nilai harapan dan variansi dari banyaknya komponen rusak di dalam pengambilan sampel tersebut. Solusi: Misalkan 𝑋 adalah variabel acak yang menunjukkan banyaknya komponen rusak di dalam sampel. Fungsi probabilitas dari 𝑋 adalah 𝑝(𝑥) = 3 4 (𝑥 )(3−𝑥 ) (73) , 𝑥 = 0,1,2,3. Diperoleh: 𝑝(0) = 𝑝(1) = 𝑝(2) = 𝑝(3) = (30)(43) (73) (31)(42) (73) (32)(41) (73) (33)(40) (73) 4 = 35, 18 = 35, 12 = 35, 1 = 35. Oleh karena itu, 4 18 12 1 𝜇 = 𝐸(𝑋) = (0) (35) + (1) (35) + (2) (35) + (3) (35) = 1.3. 3 2 𝜎 = 𝑉(𝑋) = ∑(𝑥 − 1.3)2 𝑝(𝑥) 𝑥=0 = (0 − 1.3)2 ( 4 1 ) + ⋯ + (3 − 1.3)2 ( ) 35 35 = 0.49. Contoh 2.13 Diberikan variabel acak 𝑋 yang mempunyai fungsi kontinu sebagai berikut: 𝑓(𝑥) = { (3⁄8)𝑥 2 , 0 ≤ 𝑑𝑎𝑛𝑥 ≤ 2 0 , 𝑑𝑎𝑛lainnya Temukanlah nilai harapan dan variansi bagi 𝑋. Solusi: Menurut definisi nilai harapan dan variansi, diperoleh: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 22 2 3 3 1 2 𝜇 = 𝐸(𝑋) = ∫0 𝑥 (8) 𝑥 2 𝑑𝑥 = (8) (4) 𝑥 4 ] = 1.5. 0 2 3 𝜎 2 = 𝑉(𝑋) = ∫0 (𝑥 − 1.5)2 (8) 𝑥 2 𝑑𝑥 3 2 = ( ) ∫ (𝑥 2 − 3𝑥 + 2.25)𝑥 2 𝑑𝑥 8 0 3 2 = ( ) ∫ (𝑥 4 − 3𝑥 3 + 2.25𝑥 2 )𝑑𝑥 8 0 3 1 3 2.25 3 = ( ) (( ) 𝑥 5 − ( ) 𝑥 4 + ( ) 𝑥 )] 8 5 4 3 2 0 3 5 9 4 6.75 3 2 =( 𝑥 − 𝑥 +( ) 𝑥 )] = 0.15. 40 32 24 0 Teorema 2.3 Misalkan 𝑋 adalah variabel acak diskrit dengan fungsi probabilitas 𝑝(𝑥) dan rata-rata 𝐸(𝑋) = 𝜇; maka 𝑉(𝑋) = 𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2. Bukti: 𝑉(𝑋) = 𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] = 𝐸(𝑋 2 − 2𝜇𝑋 + 𝜇 2 ) = 𝐸(𝑋 2 ) − 2𝜇𝐸(𝑋) + 𝐸(𝜇 2 ) = 𝐸(𝑋 2 ) − 2𝜇 2 + 𝜇 2 = 𝐸(𝑋 2 ) − 𝜇 2 = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2 . ∎ Contoh 2.14. Distribusi Normal Distribusi probabilitas kontinu yang paling banyak digunakan adalah distribusi Normal. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 23 Definisi 2.23 Variabel acak 𝑋 dikatakan berdistribusi Normal jika dan hanya jika untuk 𝜎 > 0 dan −∞ < 𝜇 < ∞, fungsi probabilitas dari 𝑋 adalah 1 2 /(2𝜎 2 ) 𝑓(𝑥) = 𝜎√2𝜋 𝑒 −(𝑥−𝜇) , −∞ < 𝑥 < ∞. Teorema 2.4 Jika 𝑋 adalah variabel acak berdistribusi Normal dengan parameter 𝜇 dan 𝜎, maka 𝐸(𝑋) = 𝜇 dan 𝑉(𝑋) = 𝜎 2 . Bukti: Rata-rata dari distribusi Normal diberikan dengan ∞ 𝐸(𝑋 − 𝜇) = ∫ 𝑥−𝜇 −∞ √2𝜋𝜎 1 𝑥−𝜇 2 ) 𝜎 𝑑𝑥. 𝑒 −2( Misalkan 𝑧 = (𝑥 − 𝜇)⁄𝜎 dan 𝑑𝑥 = 𝜎 𝑑𝑧, maka 𝐸(𝑋 − 𝜇) = ∞ 𝜎 √2𝜋 ∫ 𝑧𝑒 − 𝑧2 2 𝑑𝑧 = 0 −∞ karena fungsi dari 𝑧 adalah fungsi ganjil. Dengan menggunakan Teorema 2.1, diperoleh: 𝐸(𝑋 − 𝜇) = 0 𝐸(𝑋) − 𝜇 = 0 𝐸(𝑋) = 𝜇. Variansi dari distribusi Normal diberikan dengan ∞ 𝐸[(𝑋 − 𝜇)2 ] = ∫ −∞ (𝑥 − 𝜇)2 𝜎√2𝜋 𝑒 1 𝑥−𝜇 2 − ( ) 2 𝜎 𝑑𝑥. Misalkan 𝑧 = (𝑥 − 𝜇)⁄𝜎 dan 𝑑𝑥 = 𝜎 𝑑𝑧, maka 𝐸[(𝑋 − 𝜇)2 ] = 𝑧2 𝜎2 √2𝜋 ∞ 𝑧2 ∫ 𝑧 2 𝑒 − 2 𝑑𝑧. −∞ 𝑧2 Misalkan 𝑢 = 𝑧 dan 𝑑𝑣 = 𝑧𝑒 − 2 𝑑𝑧, maka 𝑑𝑢 = 𝑑𝑧 dan 𝑣 = −𝑒 − 2 , sehingga diperoleh: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 24 𝐸[(𝑋 − 𝜇) 2] = 𝜎2 √2𝜋 (−𝑧𝑒 − 𝑧2 2| ∞ ∞ 𝑧2 + ∫ 𝑒 − 2 𝑑𝑧) −∞ −∞ = 𝜎 2 (0 + 1) = 𝜎 2 . ∎ Teorema 2.4 menunjukkan bahwa parameter 𝜇 berada pada pusat distribusi dan 𝜎 mengukur penyebarannya. Grafik fungsi probabilitas Normal ditunjukkan pada gambar berikut. Gambar 2.1. Fungsi probabilitas Normal Variabel acak Normal 𝑋 dapat diubah ke variabel acak Normal standar 𝑍 dengan menggunakan hubungan 𝑍= 𝑋−𝜇 . 𝜎 Kemudian melalui Tabel distribusi Normal Standar (Tabel 𝑍), dapat digunakan untuk menghitung probabilitas. Nilai rata-rata 𝑍 harus 0 dan standar deviasinya harus 1. Contoh 2.15 Skor prestasi untuk ujian masuk perguruan tinggi memiliki rata-rata 75 dan standar deviasi 10. Hitunglah 𝑃(80 < 𝑋 < 90). Solusi: Ingat bahwa 𝑍= 𝑋−𝜇 𝜎 . PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 25 Dengan demikian, 80 − 75 𝑋 − 𝜇 90 − 75 𝑃(80 < 𝑋 < 90) = 𝑃 ( < < ) 10 𝜎 10 = 𝑃(0.5 < 𝑍 < 1.5) = 𝑃(𝑍 > 0.5) − 𝑃(𝑍 > 1.5) = 0.3085 − 0.0668 = 0.2417 Hasil tersebut dapat diperoleh dengan menggunakan Tabel 𝑍 (terlampir). Contoh 2.16 Misalkan 𝑍 adalah variabel acak Normal dengan rata-rata 0 dan standar deviasi 1. a) Temukan 𝑃(𝑍 > 2). b) Temukan 𝑃(−2 ≤ 𝑍 ≤ 2). Solusi: a) Karena 𝜇 = 0 dan 𝜎 = 1, maka dengan menggunakan Tabel distribusi Normal, diperoleh 𝑃(𝑍 > 2) = 0.0228. b) Karena fungsi probabilitas Normal simetri pada rata-rata 𝜇 = 0, maka dengan menggunakan Tabel 𝑍 (terlampir), diperoleh 𝑃(−2 ≤ 𝑍 ≤ 2) = 1 − 2(𝑃(𝑍 > 2)) = 1 − 2(0.0228) = 0.9544. Contoh 2.17. Distribusi Chi-Square Variabel acak kontinu 𝑋 berdistribusi chi-square dengan derajat bebas 𝑣, jika fungsi probabilitasnya diberikan dengan 1 𝑣 𝑥2 𝑣 2 2 Γ(𝑣⁄2) 𝑓(𝑥; 𝑣) = { 0 −1 − 𝑒 𝑥 2, 𝑑𝑎𝑛𝑥 > 0, , 𝑑𝑎𝑛lainnya, dengan 𝑣 adalah bilangan bulat positif dan Γ(𝑣⁄2) adalah fungsi Gamma. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 26 Teorema 2.5 Jika 𝑋 adalah variabel acak berdistribusi chi-square dengan derajat bebas 𝑣, maka nilai harapan (rata-rata) dan variansinya adalah 𝜇 = 𝐸(𝑋) = 𝑣 dan 𝜎 2 = 𝑉(𝑋) = 2𝑣. Bukti: Misalkan 𝑐 = 1 𝑣 22 Γ(𝑣⁄2) . ∞ 𝑣 𝑥 −1 − 𝐸(𝑋) = ∫ 𝑥𝑐𝑥 2 𝑒 2 𝑑𝑥 0 ∞ 𝑣 𝑥 = 𝑐 ∫ 𝑥 2 𝑒 −2 𝑑𝑥 0 ∞ 𝑣 𝑥 ∞ 𝑥 𝑣 𝑣 = 𝑐 {[−2𝑥 2 𝑒 −2 ] + ∫ 2 𝑥 2−1 𝑒 −2 𝑑𝑥} 2 0 0 ∞ 𝑣 𝑥 = 𝑐 {(0 − 0) + 𝑣 ∫ 𝑥 2−1 𝑒 −2 𝑑𝑥} 0 ∞ 𝑣 𝑥 = 𝑣 ∫ 𝑐𝑥 2−1 𝑒 −2 𝑑𝑥 0 = 𝑣. (berdasarkan Definisi 2.13 (2)) Berdasarkan Teorema 2.3, 𝑉(𝑋) = 𝐸[(𝑋 − 𝜇)2 ] = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2 . ∞ 𝐸(𝑋 2) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥 −∞ ∞ 𝑣 𝑥 = ∫ 𝑥 2 𝑐𝑥 2−1 𝑒 −2 𝑑𝑥 0 ∞ 𝑣 𝑥 = 𝑐 ∫ 𝑥 2+1 𝑒 −2 𝑑𝑥 0 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 27 ∞ 𝑣 𝑥 ∞ 𝑣 𝑥 𝑣 = 𝑐 {−2𝑥 2+1 𝑒 −2 ] + ∫ 2 ( + 1) 𝑥 2 𝑒 −2 𝑑𝑥} 2 0 0 ∞ 𝑣 𝑥 = 𝑐 {(0 − 0) + (𝑣 + 2) ∫ 𝑥 2 𝑒 −2 𝑑𝑥} 0 ∞ 𝑣 𝑥 = 𝑐(𝑣 + 2) {∫ 𝑥 2 𝑒 −2 𝑑𝑥 } 0 = 𝑐(𝑣 + 𝑣 𝑥 ∞ 2) {[−2𝑥 2 𝑒 −2 ] 0 ∞ 𝑥 𝑣 𝑣 + ∫ 2 𝑥 2−1 𝑒 −2 𝑑𝑥} 2 0 ∞ 𝑣 𝑥 = 𝑐(𝑣 + 2) {(0 − 0) + 𝑣 ∫ 𝑥 2−1 𝑒 −2 𝑑𝑥} 0 ∞ 𝑣 𝑥 = 𝑣(𝑣 + 2) {∫ 𝑐𝑥 2−1 𝑒 −2 𝑑𝑥} 0 ∞ = 𝑣(𝑣 + 2){∫0 𝑥𝑓(𝑥)𝑑𝑥 } = 𝑣(𝑣 + 2), (berdasarkan Definisi 2.13 (2)) [𝐸(𝑋)]2 = 𝑣 2 𝑉(𝑋) = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2 = 𝑣(𝑣 + 2) − 𝑣 2 = 𝑣(𝑣 + 2 − 𝑣) = 2𝑣. c. Momen dan Fungsi Pembangkit Momen (FPM) Definisi 2.24 Momen ke-𝑘 dari variabel acak 𝑋 didefinisikan sebagai 𝐸(𝑋 𝑘 ) dan dinotasikan dengan 𝜇′𝑘 dengan 𝑘 = 1,2,3, … . ∎ PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 28 Definisi 2.25 Fungsi pembangkit momen dari variabel acak 𝑋 diberikan dengan 𝐸(𝑒 𝑡𝑋 ) dan dinotasikan dengan 𝑀𝑋 (𝑡), 𝑡 ∈ ℝ. Oleh karena itu, ∑ 𝑒 𝑡𝑥 𝑝(𝑥) , jika 𝑑𝑎𝑛𝑋 diskrit, 𝑥 ∞ 𝑀𝑋 (𝑡) = 𝐸(𝑒 𝑡𝑋 ) = ∫ 𝑒 𝑡𝑥 𝑓(𝑥) 𝑑𝑥 , jika 𝑑𝑎𝑛𝑋 kontinu. { −∞ Contoh 2.18 Temukanlah FPM dari Contoh 2.12 dan Contoh 2.13. Solusi: Untuk Contoh 2.12, diperoleh: 𝑡𝑋 𝑡𝑥 𝑀𝑋 (𝑡) = 𝐸(𝑒 ) = ∑ 𝑒 𝑝(𝑥) 𝑥 = 𝑒 0𝑡 𝑝(0) + 𝑒 𝑡 𝑝(1) + 𝑒 2𝑡 𝑝(2) + 𝑒 3𝑡 𝑝(3) = 4 18 𝑡 12 2𝑡 1 + 𝑒 + 𝑒 + 𝑒 3𝑡 . 35 35 35 35 = 1 (4 + 18𝑒 𝑡 + 12𝑒 2𝑡 + 𝑒 3𝑡 ); 𝑡 ∈ ℝ. 35 Untuk Contoh 2.13, diperoleh: ∞ 𝑀𝑋 (𝑡) = 𝐸(𝑒 𝑡𝑋 ) = ∫ 𝑒 𝑡𝑥 𝑓(𝑥) 𝑑𝑥 −∞ = 3 2 2 𝑡𝑥 ∫ 𝑥 𝑒 𝑑𝑥 8 0 Dengan menggunakan integral parsial, diperoleh hasil sebagai berikut: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 29 2 3 𝑥 2 𝑒 𝑡𝑥 2 2 𝑀𝑋 (𝑡) = {[ ] − ∫ 𝑥𝑒 𝑡𝑥 𝑑𝑥} 8 𝑡 0 𝑡 0 = 3 4𝑒 2𝑡 2 2 [( ) − ∫ 𝑥𝑒 𝑡𝑥 𝑑𝑥 ] 8 𝑡 𝑡 0 Dengan menggunakan kembali integral parsial, diperoleh: 2 3 4𝑒 2𝑡 2 𝑥𝑒 𝑡𝑥 1 2 𝑡𝑥 𝑀𝑋 (𝑡) = [( )− ( ] − ∫ 𝑒 𝑑𝑥)] 8 𝑡 𝑡 𝑡 0 𝑡 0 2 3 4𝑒 2𝑡 2 2𝑒 2𝑡 1 𝑒 𝑡𝑥 = [( )− ( − [ ] )] 8 𝑡 𝑡 𝑡 𝑡 𝑡 0 = 3 4𝑒 2𝑡 2 2𝑒 2𝑡 1 𝑒 2𝑡 1 [( )− ( − ( − ))] 8 𝑡 𝑡 𝑡 𝑡 𝑡 𝑡 = 3 4𝑒 2𝑡 2 2𝑒 2𝑡 𝑒 2𝑡 1 [( )− ( − 2 + 2 )] 8 𝑡 𝑡 𝑡 𝑡 𝑡 = 3 4𝑒 2𝑡 4𝑒 2𝑡 2𝑒 2𝑡 + 2 [ − 2 + ] 8 𝑡 𝑡 𝑡3 3 2 2𝑒 2𝑡 𝑒 2𝑡 + 1 2𝑡 = [ (2𝑒 − + )] 8 𝑡 𝑡 𝑡2 = 3 2𝑒 2𝑡 𝑒 2𝑡 + 1 (2𝑒 2𝑡 − + ). 4𝑡 𝑡 𝑡2 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 30 C. Distribusi Sampling Kesimpulan pada statistika pada dasarnya berkaitan dengan generalisasi dan dugaan yang diperoleh dari sampel. Oleh karena itu, sampel yang diamati harus memiliki distribusi probabilitas. Definisi 2.26 Distribusi probabilitas dari statistik disebut sebagai distribusi sampling. Distribusi sampling dari statistik bergantung pada distribusi populasi, ukuran sampel, dan metode pemilihan sampel. Distribusi probabilitas dari 𝑥̅ disebut distribusi sampling dari rata-rata. Distribusi sampling dari 𝑥̅ dan 𝑠 2 dapat digunakan untuk membuat kesimpulan pada parameter 𝜇 dan 𝜎 2 . 1. Teorema Limit Pusat Jika dilakukan penarikan sampel dari populasi dengan distribusi yang tidak diketahui, maka distribusi sampling dari 𝑥̅ akan tetap mendekati 2 Normal dengan rata-rata 𝜇 dan variansi 𝜎 ⁄𝑛, asalkan ukuran sampelnya besar. Hal ini adalah akibat langsung dari Teorema Limit Pusat (TLP). Teorema 2.6 (TLP) Misalkan 𝑥1 , 𝑥2 , … , 𝑥𝑛 merupakan variabel acak saling bebas dan terdistribusi dengan 𝐸(𝑥𝑖 ) = 𝜇 dan 𝑉(𝑥𝑖 ) = 𝜎 2 < ∞. Variabel acak 𝑈𝑛 didefinisikan sebagai 𝑥̅ −𝜇 1 dengan 𝑥̅ = 𝑛 ∑𝑛𝑖=1 𝑥𝑖 . 𝑈𝑛 = (𝜎/ 𝑛) √ Fungsi distribusi dari 𝑈𝑛 konvergen ke fungsi distribusi Normal standar untuk 𝑛 → ∞, yaitu 𝑢 lim 𝑃(𝑈𝑛 ≤ 𝑢) = ∫ 𝑛→∞ 1 −∞ √2𝜋 𝑒 −𝑡 2 ⁄2 𝑑𝑡, ∀𝑢 . PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 31 Teorema 2.7 Misalkan 𝑋 dan 𝑋1 , 𝑋2 , … , 𝑋𝑛 adalah variabel acak dengan FPM 𝑚(𝑡) dan 𝑚1 (𝑡), 𝑚2 (𝑡), 𝑚3 (𝑡), …, dan seterusnya. Jika lim 𝑚𝑛 (𝑡) = 𝑚(𝑡), ∀𝑡 ∈ ℝ, 𝑛→∞ maka fungsi distribusi dari 𝑋𝑛 konvergen ke fungsi distribusi dari 𝑋 untuk 𝑛 → ∞. Bukti: Bukti terdapat pada buku Williams, David. (1991). Probability with Martingales. New York: Cambridge University Press. Halaman: 185. Bukti Teorema Limit Pusat Diketahui: ∑𝑛𝑖=1 𝑥𝑖 −𝜇 𝑥̅ − 𝜇 𝑈𝑛 = √𝑛 ( ) = √𝑛 ( 𝑛 ) 𝜎 𝜎 ∑𝑛 𝑖=1 𝑋𝑖 −𝑛𝜇 = √𝑛 ( dengan 𝑧𝑖 = 𝑛𝜎 𝑋𝑖 −𝜇 𝜎 )= 𝑛 √𝑛 ∑𝑖=1 𝑋𝑖 −𝑛𝜇 ( ) 𝑛 𝜎 = 1 √𝑛 (∑𝑛𝑖=1 𝑧𝑖 ), . Karena variabel acak 𝑥𝑖 saling bebas dan berdistribusi secara identik, maka 𝑧𝑖 dengan 𝑖 = 1,2, . . . , 𝑛 juga saling bebas dan berdistribusi secara identik dengan 𝐸(𝑧𝑖 ) = 0 dan 𝑉(𝑧𝑖 ) = 1. Karena fpm dari banyaknya variabel acak saling bebas masing-masing adalah hasil kali dari masing-masing fpm, maka 𝑚∑ 𝑍𝑖 (𝑡) = 𝑚𝑍1 (𝑡) × 𝑚𝑍2 (𝑡) … × 𝑚𝑍𝑛 (𝑡) = [𝑚𝑍1 (𝑡)] 𝑛 dan 𝑡 𝑡 √ √ 𝑛 𝑚𝑈𝑛 (𝑡) = 𝑚∑ 𝑍𝑖 ( 𝑛) = [𝑚𝑍1 ( 𝑛)] . Dengan menggunakan Teorema Deret Taylor di sekitar 0 dan dengan suku sisa bentuk Lagrange, 𝑡2 𝑚𝑍1 (𝑡) = 𝑚𝑍1 (0) + 𝑚′𝑍1 (0)𝑡 + 𝑚′′𝑍1 (𝜉) 2 , dengan 0 < 𝜉 < 𝑡, PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 32 sehingga 𝑛 𝑚′′𝑍1 (𝜉𝑛 ) 𝑡 2 (𝑡) 𝑚𝑈𝑛 = [1 + ( ) ] 2 √𝑛 = [1 + 𝑚′′𝑍1 (𝜉𝑛 )𝑡 2 2𝑛 𝑛 ] , dengan 0 < 𝜉𝑛 < 𝑡 . √𝑛 Perhatikan bahwa karena 𝑛 → ∞, 𝜉𝑛 → 0 dan 𝑚′′𝑍1 (𝜉𝑛 )(𝑡 2 ⁄2) → 𝑚′′𝑍1 (0)(𝑡 2 ⁄2) = 𝐸(𝑍12 )(𝑡 2 ⁄2) = (𝑡 2 ⁄2) dengan 𝐸(𝑍12 ) = 𝑉(𝑍1 ) = 1. Perlu diingat bahwa jika lim 𝑏𝑛 = 𝑏, maka lim (1 + 𝑛→∞ 𝑛→∞ 𝑏𝑛 𝑛 𝑛 ) = 𝑒𝑏. Akhirnya diperoleh, lim 𝑚𝑈𝑛 (𝑡) = lim [1 + 𝑛→∞ 𝑚′′𝑍1 (𝜉𝑛 )(𝑡 2 ⁄2) 𝑛→∞ 𝑛 𝑛 ] = 𝑒 (𝑡 2 ⁄2) , fpm untuk variabel acak Normal standar. Dengan menerapkan Teorema 2.7, dapat disimpulkan bahwa 𝑈𝑛 memiliki fungsi distribusi yang konvergen ke fungsi distribusi dari variabel acak Normal standar. ∎ Distribusi 𝑡 2. Definisi 2.27 𝑥̅ −𝜇 (𝑛−1)𝑠2 √ 𝜎2 Misalkan 𝑍 = 𝜎/ adalah variabel acak Normal standar dan 𝑊 = 𝑛 berdistribusi 𝜒 2 dengan derajat bebas 𝑣. Jika 𝑍 dan 𝑊 saling bebas, maka 𝑇= 𝑍 √𝑊/𝑣 berdistribusi 𝑡 dengan derajat bebas 𝑣. Lemma 2.3 Misalkan 𝑥1 , 𝑥2 , … , 𝑥𝑛 sebagai variabel acak saling bebas berdistribusi Normal dengan rata-rata 𝜇 dan standar deviasi 𝜎; maka variabel acak 𝑇 = 𝑥̅ −𝜇 𝑠/√𝑛 berdistribusi 𝑡 dengan derajat bebas 𝑣 = 𝑛 − 1. Bukti: Berdasarkan Definisi 2.27, PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 33 𝑇= 𝑍 = √𝑊/𝑣 = = (𝑥̅ − 𝜇)⁄(𝜎/√𝑛) √[(𝑛 − 1)𝑠 2 /𝜎 2 ]⁄(𝑛 − 1) √𝑛(𝑥̅ − 𝜇)⁄𝜎 √𝑠 2 /𝜎 2 √𝑛(𝑥̅ − 𝜇)⁄𝜎 √𝑛(𝑥̅ − 𝜇) = 𝑠/𝜎 𝑠 berdistribusi 𝑡 dengan derajat bebas 𝑣 = (𝑛 − 1). ∎ Contoh 2.19 Temukan 𝑃(−𝑡0.025 < 𝑇 < 𝑡0.025 ). Solusi: Dari tabel distribusi 𝑡 (terlampir) diperoleh, 𝑃(−𝑡0.025 < 𝑇 < 𝑡0.025 ) = 1 − 0.05 − 0.025 = 0.925. D. Pendugaan Parameter Pendugaan adalah pokok bahasan dalam statistika yang berhubungan dengan pendugaan nilai-nilai parameter berdasarkan data yang diukur/data empiris yang berasal dari sampel acak. Tujuan dari percobaan atau penelitian statistik adalah untuk menduga satu atau lebih parameter yang relvan. Pendugaan parameter adalah suatu proses untuk membuat kesimpulan tentang parameter populasi berdasarkan sampel acak. 1. Pendugaan (Estimasi) Di dalam statistika, pendugaan-pendugaan dilakukan untuk menyimpulkan karakteristik dari populasi (parameter). Definisi 2.28 (Wackerly, et al., 2008: 391) Penduga adalah suatu aturan, yang dinyatakan dalam bentuk rumus, yang memberitahukan bagaimana cara menghitung nilai suatu dugaan berdasarkan pengukuran yang termuat di dalam sampel. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 34 Penduga dari parameter 𝜃 adalah statistik 𝜃̂. Contoh dari parameter 𝜃 dapat berupa rata-rata µ, standar deviasi 𝜎, dan proporsi 𝑝 yang diduga dengan rata-rata 𝑥̅ , standar deviasi 𝑠, dan proporsi 𝑝̂ . 2. Macam-Macam Pendugaan Parameter Nilai parameter dapat diduga dengan dua cara, yakni: penduga titik dan penduga selang. 2.1. Penduga Titik Definisi 2.29 Penduga titik adalah penentuan suatu nilai tunggal berdasarkan atas sampel yang dengan baik menduga parameter yang sebenarnya. Bias dan Rata-rata Galat Kuadrat dari Penduga Titik Dalam pemilihan sampel, hal yang sering dilakukan adalah memilih anggota yang paling cocok dari populasi. Cara tersebut dapat menyebabkan kesimpulan yang keliru mengenai populasi dan dapat dikatakan sebagai bias. Oleh karena itu, diperlukan pemilihan sampel secara acak. Misalkan seorang pria menembak satu tembakan pada suatu sasaran dan mengenai sasaran tersebut. Apakah dapat disimpulkan bahwa pria tersebut adalah penembak jitu? Apakah ingin disimpulkan dugaan sementara pada tembakan kedua? Jelas, tidak bisa disimpulkan bahwa pria tersebut adalah seorang ahli menembak berdasarkan bukti yang sedikit. Di sisi lain, jika 100 tembakan berturut-turut dapat menembak tepat sasaran, mungkin dapat diperoleh keyakinan bahwa orang tersebut adalah seorang penembak jitu dan berkeyakinan besar untuk menembak tepat sasaran. Dapat dikatakan bahwa hal itu adalah distribusi dari pendugaan yang tepat mengenai parameter sasaran, seperti yang ditunjukkan pada Gambar 2.2. Dengan kata lain, rata-rata atau nilai yang diharapkan dari distribusi nilai dugaan akan sama dengan parameter nilai dugaan, PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 35 yaitu 𝐸(𝜃̂) = 𝜃. Penduga titik yang memenuhi sifat ini dikatakan sebagai penduga tak bias. Distribusi sampling untuk suatu penduga titik bias positif adalah 𝐸(𝜃̂) > 𝜃, ditunjukkan pada Gambar 2.3. 𝜃 𝜃̂ Gambar 2.2. Distribusi Nilai Dugaan Gambar 2.3. Distribusi Sampling untuk Penduga Titik Bias Positif Definisi 2.30 Misalkan 𝜃̂ adalah penduga titik dari parameter 𝜃, maka 𝜃̂ adalah penduga tak bias bagi 𝜃 jika 𝐸(𝜃̂) = 𝜃. Jika 𝐸(𝜃̂ ) ≠ 𝜃, maka 𝜃̂ dikatakan penduga yang bias bagi 𝜃. Definisi 2.31 Bias dari penduga titik 𝜃̂ didefinisikan sebagai 𝐵(𝜃̂ ) = 𝐸(𝜃̂) − 𝜃. Contoh 2.20 Misalkan 𝑥1 , 𝑥2 , … , 𝑥𝑛 adalah sampel acak dengan 𝐸(𝑥𝑖 ) = 𝜇 dan 1 2 𝑉(𝑥𝑖 ) = 𝜎 2 . Tunjukkan bahwa 𝑠 ′ = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 adalah 1 penduga bias bagi 𝜎 2 dan bahwa 𝑠 2 = 𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 adalah penduga tak bias bagi 𝜎 2 . PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 36 Solusi: 𝑛 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2 = ∑(𝑥𝑖2 − 2𝑥̅ 𝑥𝑖 + 𝑥̅ 2 ) 𝑖=1 𝑖=1 𝑛 = 𝑛 ∑ 𝑥𝑖2 𝑖=1 𝑛 − 2𝑥̅ ∑ 𝑥𝑖 + ∑ 𝑥̅ 2 𝑖=1 𝑖=1 𝑛 = ∑ 𝑥𝑖2 − 2𝑥̅ 𝑛 𝑥̅ + 𝑛𝑥̅ 2 𝑖=1 𝑛 = 𝑛 ∑ 𝑥𝑖2 𝑖=1 − 2𝑛𝑥̅ 2 + 𝑛𝑥̅ 2 = ∑ 𝑥𝑖2 − 𝑛𝑥̅ 2 𝑖=1 sehingga, 𝑛 )2 𝐸 [∑(𝑥𝑖 − 𝑥̅ ] = 𝑖=1 𝑛 𝑛 𝐸 [∑ 𝑥𝑖2 𝑖=1 − 𝑛𝑥̅ ] = 𝐸 [∑ 𝑥𝑖2 ] − n𝐸[𝑥̅ 2 ] 2 𝑖=1 𝑛 = ∑ 𝐸[𝑥𝑖2 ] − n𝐸[𝑥̅ 2 ] 𝑖=1 Karena 𝐸[𝑋𝑖2 ] sama untuk ∀𝑖 = 1,2, … , 𝑛 dan 𝑉(𝑋) = 𝐸[𝑋 2 ] − (𝐸[𝑋])2 = 𝐸[𝑋 2 ] − 𝜇 2, maka 𝐸[𝑋 2 ] = 𝑉(𝑋) + 𝜇 2 dan 𝑛 𝑛 𝐸 [∑(𝑥𝑖 − 𝑥̅ ] = ∑ 𝐸[𝑥𝑖2 ] − n𝐸[𝑥̅ 2 ] )2 𝑖=1 𝑖=1 𝑛 = ∑[𝑉(𝑥𝑖 ) + 𝜇 2 ] − 𝑛[𝑉(𝑥̅ ) + 𝜇 2 ] 𝑖=1 𝑛 𝜎2 = ∑(𝜎 2 + 𝜇 2 ) − 𝑛 ( + 𝜇 2 ) 𝑛 𝑖=1 = 𝑛(𝜎 2 + 𝜇 2 ) − 𝑛 ( 𝜎2 + 𝜇2) 𝑛 = 𝑛𝜎 2 + 𝑛𝜇 2 − 𝜎 2 − 𝑛𝜇 2 = (𝑛 − 1)𝜎 2 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 37 Oleh karena itu, 1 1 2 𝐸(𝑠 ′ ) = 𝑛 𝐸[∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ] = 𝑛 [(𝑛 − 1)𝜎 2 ] = 𝑛 𝑛−1 Dengan demikian, 𝑠 ′ 2 𝑛−1 𝑛 𝜎 2 , maka 2 𝐸(𝑠 ′ ) = 𝜎 2 . adalah penduga bias bagi 𝜎 2 karena 2 𝐸(𝑠 ′ ) ≠ 𝜎 2 . Akan tetapi, 𝑛 𝐸(𝑠 2) 1 = 𝐸 [∑(𝑥𝑖 − 𝑥̅ )2 ] 𝑛−1 𝑖=1 1 [(𝑛 − 1)𝜎 2 ] 𝑛−1 𝑛−1 2 = 𝜎 = 𝜎2, 𝑛−1 = sehingga 𝑠 2 adalah penduga tak bias bagi 𝜎 2 karena 𝐸(𝑠 2 ) = 𝜎 2 . Definisi 2.32 Rata-rata kuadrat galat (Mean Square Error) dari penduga titik 𝜃̂ adalah 2 𝑀𝑆𝐸(𝜃̂) = 𝐸 [(𝜃̂ − 𝜃) ]. 𝑀𝑆𝐸(𝜃̂) adalah fungsi dari variansi dan biasnya. Definisi 2.33 2 Variansi penduga titik 𝜃̂ adalah 𝑉(𝜃̂) = 𝐸 [(𝜃̂ − 𝐸(𝜃̂ )) ]. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 38 Teorema 2.8 Jika 𝐵(𝜃̂) menunjukkan bias dari penduga titik 𝜃̂, maka 2 𝑀𝑆𝐸(𝜃̂) = 𝑉(𝜃̂ ) + [𝐵(𝜃̂ )] . Bukti: Petunjuk: (𝜃̂ − 𝜃) = [𝜃̂ − 𝐸(𝜃̂)] + [𝐸(𝜃̂) − 𝜃] = [𝜃̂ − 𝐸(𝜃̂)] + 𝐵(𝜃̂). Dengan menggunakan petunjuk di atas, diperoleh: 2 𝑀𝑆𝐸(𝜃̂) = 𝐸 [(𝜃̂ − 𝜃) ] = 𝐸 [((𝜃̂ − 𝐸(𝜃̂)) + 𝐵(𝜃̂ )) ∙ ((𝜃̂ − 𝐸(𝜃̂)) + 𝐵(𝜃̂))] 2 2 = 𝐸 [(𝜃̂ − 𝐸(𝜃̂)) + 2 (𝜃̂ − 𝐸(𝜃̂)) 𝐵(𝜃̂) + (𝐵(𝜃̂)) ] 2 2 = 𝐸 [(𝜃̂ − 𝐸(𝜃̂)) ] + 2𝐵(𝜃̂)𝐸[𝜃̂ − 𝐸(𝜃̂)] + [𝐵(𝜃̂)] = 𝑉(𝜃̂) + 2𝐵(𝜃̂)(𝐸[𝜃̂] − 𝐸[𝐸(𝜃̂)]) + [𝐵(𝜃̂)] 2 2 = 𝑉(𝜃̂) + 2𝐵(𝜃̂)[𝐸(𝜃̂) − 𝐸(𝜃̂)] + [𝐵(𝜃̂)] 2 = 𝑉(𝜃̂) + [𝐵(𝜃̂)] . ∎ Tabel 2.2. Nilai Harapan dan galat standar Beberapa Penduga Titik Penduga Parameter Ukuran Galat standar Titik Sasaran ̂ 𝐸(𝜃 ) Sampel 𝜎𝜃 ̂ 𝜃 𝜃 𝜇 𝑛 𝑋̅ 𝑝 𝑛 𝑝̂ = 𝜇1 − 𝜇2 𝑛1 dan 𝑛2 𝑋̅1 − 𝑋̅2 𝜇1 − 𝜇2 𝑝1 − 𝑝2 𝑛1 dan 𝑛2 𝑝̂1 − 𝑝̂2 𝑝̂1 − 𝑝̂2 𝜇 𝑋 𝑛 𝑝 𝜎 √𝑛 𝑝𝑞 √ 𝑛 𝜎2 𝜎2 √ 1 + 2 𝑛1 𝑛2 𝑝1 𝑞1 𝑝2 𝑞2 + √ 𝑛1 𝑛2 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 39 2.2. Penduga Selang Kepercayaan Definisi 2.33 Penduga selang adalah suatu penentuan selang nilai yang dihitung berdasarkan pengukuran sampel dan mempunyai peluang tertentu, akan memuat parameter yang sebenarnya. Idealnya, selang yang dihasilkan akan memiliki dua sifat: Pertama, akan memuat parameter sasaran 𝜃; kedua, menghasilkan selang yang relatif sempit. Salah satu atau kedua batas dari selang menjadi fungsi dari pengukuran sampel, yang akan bervariasi secara acak dari sampel yang satu ke sampel lainnya. Penduga selang biasa disebut “Selang Kepercayaan”. Probabilitas bahwa selang kepercayaan akan memuat parameter sasaran 𝜃 disebut “Koefisien Kepercayaan”. Jika diketahui bahwa koefisien kepercayaan memiliki nilai yang tinggi, maka dapat dipercaya bahwa setiap selang kepercayaan yang dibentuk dengan menggunakan hasil dari sampel akan memuat parameter sasaran 𝜃. Misalkan 𝜃̂𝐿 dan 𝜃̂𝑈 adalah batas bawah dan atas untuk parameter 𝜃. Jika 𝑃(𝜃̂𝐿 ≤ 𝜃 ≤ 𝜃̂𝑈 ) = 1 − 𝛼, untuk 0 < 𝛼 < 1, maka probabilitas (1 − 𝛼) adalah koefisien kepercayaan. Selang 𝜃̂𝐿 ≤ 𝜃 ≤ 𝜃̂𝑈 dihitung dari sampel yang diseleksi, ini adalah selang kepercayaan 100(1 − 𝛼)%, dan titik akhir 𝜃̂𝐿 dan 𝜃̂𝑈 sebagai titik batas terbesar dan terkecil dari selang kepercayaan. Jadi, sebagai contohnya, ketika 𝛼 = 0.05, berarti diperoleh selang kepercayaan 95%, dan ketika 𝛼 = 0.01, diperoleh selang kepercayaan 99%. Semakin lebar selang kepercayaan, maka selang kepercayaan tersebut memuat parameter yang tidak diketahui. Akan tetapi, lebih baik jika menghasilkan selang yang relatif pendek dengan tingkat kepercayaan yang tinggi. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 40 Selang acak yang dihasilkan didefinisikan dengan [𝜃̂𝐿 , 𝜃̂𝑈 ] yang disebut sebagai “Selang Kepercayaan Dua Sisi”. Definisi 2.34 Selang kepercayaan satu sisi yang dinyatakan dengan 𝑃(𝜃̂𝐿 ≤ 𝜃) = 1 − 𝛼 akan menghasilkan selang kepercayaan satu sisi bawah, yaitu [𝜃̂𝐿 , ∞), dan 𝑃(𝜃 ≤ 𝜃̂𝑈 ) = 1 − 𝛼 akan menghasilkan selang kepercayaan satu sisi atas, yaitu (−∞, 𝜃̂𝑈 ]. Salah satu metode yang sangat berguna untuk mencari selang kepercayaan adalah Metode Pivot. Metode ini tergantung pada suatu nilai yang disebut besaran Pivot. Besaran ini memiliki dua karakteristik, yaitu: i. Merupakan fungsi dari pengukuran sampel dan parameter 𝜃 yang tidak diketahui. ii. Distribusi probabilitas dari besaran ini tidak tergantung pada parameter 𝜃. Jika distribusi probabilitas dari besaran Pivot diketahui, maka besaran tersebut dapat digunakan untuk membentuk nilai dugaan selang yang diinginkan. Contoh 2.21 Diberikan pengamatan tunggal 𝑋 dari distribusi eksponensial dengan rata-rata 𝜃. Gunakan 𝑋 untuk membentuk selang kepercayaan bagi 𝜃 dengan koefisien kepercayaan 0.90. Solusi: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 41 Fungsi densitas probabilitas bagi 𝑋 diberikan dengan 1 𝑥 ( ) 𝑒 − ⁄𝜃 , 𝑓(𝑥) = { 𝜃 0 , 𝑑𝑎𝑛𝑥 ≥ 0 danlainnya 𝑋 Dengan menggunakan Metode Pivot, akan diperiksa apakah 𝑈 = 𝜃 memenuhi syarat sebagai besaran Pivot? 𝑋 1) 𝑈 = 𝜃 adalah fungsi dari 𝑋 (ukuran sampel) dan 𝜃 tidak diketahui. 𝑋 2) 𝑈 = 𝜃 𝑓𝑢 (𝑢) = ⋯ ? Untuk 𝑥 < 0, 𝐹(𝑥) = 0. Untuk 𝑥 ≥ 0, 0 𝑥 1 1 𝑡 𝑡 𝑥 𝐹(𝑥) = ∫ 0 𝑑𝑡 + ∫ ( ) 𝑒 − ⁄𝜃 𝑑𝑡 = (−𝜃)𝑒 − ⁄𝜃 ] 0 𝜃 −∞ 0 𝜃 = −𝑒 − 𝑥⁄ 𝜃 0 , 𝐹(𝑥) = { −𝑥⁄ −𝑒 𝜃 + 1, + 1. 𝑑𝑎𝑛𝑥 < 0 𝑑𝑎𝑛𝑥 ≥ 0 𝑋 𝐹𝑢 (𝑢) = 𝑃(𝑈 ≤ 𝑢) = 𝑃 ( ≤ 𝑢) 𝜃 = 𝑃(𝑋 ≤ 𝑢𝜃) = 𝐹(𝑢𝜃) = −𝑒 − = −𝑒 −𝑢 + 1. 0 , −𝑢 −𝑒 + 1, 𝑑𝑎𝑛𝑢 < 0 𝑑𝑎𝑛𝑢 ≥ 0 0 𝑒 −𝑢 𝑑𝑎𝑛𝑢 < 0 𝑑𝑎𝑛𝑢 ≥ 0 𝐹𝑢 (𝑢) = { 𝑓𝑢 (𝑢) = { , , 𝑓𝑢 (𝑢) tidak bergantung pada 𝜃. 𝑢𝜃⁄ 𝜃 +1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 42 Kedua syarat besaran Pivot terpenuhi f(u) 0.05 0.05 0.90 a b u Gambar 2.4. Fungsi probabilitas bagi 𝑈 Selanjutnya akan dicari selang kepercayaan bagi 𝜃 𝑎 ∗ 𝑃(𝑈 < 𝑎) = ∫0 𝑒 −𝑢 𝑑𝑢 = 0.05 −𝑒 −𝑢 ] 𝑎 = 0.05 0 1−𝑒 −𝑎 = 0.05 𝑒 −𝑎 = 0.95 ln(𝑒 −𝑎 ) = ln(0.95) −𝑎 = −0.051 𝑎 = 0.051 ∞ *𝑃(𝑈 > 𝑏) = ∫𝑏 𝑒 −𝑢 𝑑𝑢 = 0.05 −𝑒 −𝑢 ] ∞ = 0.05 𝑏 𝑒 −𝑏 = 0.05 ln(𝑒 −𝑏 ) = ln(0.05) −𝑏 = −2.996 𝑏 = 2.996 sehingga, 𝑋 0.9 = 𝑃(0.051 ≤ 𝑈 ≤ 2.996) = 𝑃 (0.051 ≤ 𝜃 ≤ 2.996). Karena akan dicari penduga selang bagi 𝜃, maka diperoleh: 𝑋 0.051 1 2.996 ≤ 2.996) = 𝑃 ( ≤ ≤ ) 𝜃 𝑋 𝜃 𝑋 𝑋 𝑋 𝑋 𝑋 0.9 = 𝑃 ( ≥𝜃≥ ) = 𝑃( ≤𝜃≤ ) 0.051 2.996 2.996 0.051 0.9 = 𝑃 (0.051 ≤ PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 43 Dengan demikian, diperoleh batas bawah dan batas atas untuk selang 𝑋 𝑋 kepercayaan 𝜃 adalah 2.996 dan 0.051. 2.3. Selang Kepercayaan Sampel Besar Untuk sampel besar, semua penduga titik akan mendekati distribusi sampling Normal dengan galat standar yang telah ditunjukkan pada Tabel 2.2. Jika parameter sasaran 𝜃 adalah 𝜇, 𝑝, 𝜇1 − 𝜇2 , atau 𝑝1 − 𝑝2 , maka untuk sampel besar, 𝑍= 𝜃̂ − 𝜃 𝜎𝜃̂ akan mendekati distribusi Normal standar. Akibatnya, 𝑍 adalah suatu besaran Pivot dan Metode Pivot dapat digunakan untuk menghasilkan selang kepercayaan untuk parameter sasaran 𝜃. Contoh 2.22 Misalkan 𝜃̂ adalah statistik berdistribusi Normal dengan rata-rata 𝜃 dan galat standar 𝜎𝜃 . Temukan selang kepercayaan bagi 𝜃 yang memiliki koefisien kepercayaan (1 − 𝛼). Solusi: Nilai 𝑍 = ̂ −𝜃 𝜃 𝜎𝜃 ̂ berdistribusi Normal. Sekarang, pilih dua nilai di dalam selang, yaitu 𝑧𝛼⁄2 dan −𝑧𝛼⁄2 , sehingga 𝑃(−𝑧𝛼⁄2 ≤ 𝑍 ≤ 𝑧𝛼⁄2 ) = 1 − 𝛼. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 44 α/2 1-α −𝑧𝛼 ⁄2 0 α/2 𝑧𝛼 ⁄2 Gambar 2.5. Letak −𝑧𝛼⁄2 dan 𝑧𝛼⁄2 Dengan mensubstitusi nilai 𝑍 = 𝑃 (−𝑧𝛼⁄2 ≤ ̂ −𝜃 𝜃 ̂ −𝜃 𝜃 𝜎𝜃 ̂ 𝜎𝜃 ̂ , diperoleh ≤ 𝑧𝛼⁄2 ) = 1 − 𝛼. Pada ketidaksamaan tersebut, kalikan semuanya dengan 𝜎𝜃̂ , diperoleh 𝑃(−𝑧𝛼⁄2 𝜎𝜃̂ ≤ 𝜃̂ − 𝜃 ≤ 𝑧𝛼⁄2 𝜎𝜃̂ ) = 1 − 𝛼 𝑃(−𝜃̂ − 𝑧𝛼⁄2 𝜎𝜃̂ ≤ −𝜃 ≤ −𝜃̂ + 𝑧𝛼⁄2 𝜎𝜃̂ ) = 1 − 𝛼 𝑃(𝜃̂ − 𝑧𝛼⁄2 𝜎𝜃̂ ≤ 𝜃 ≤ 𝜃̂ + 𝑧𝛼⁄2 𝜎𝜃̂ ) = 1 − 𝛼 Dengan demikian, titik akhir untuk 100(1 − 𝛼)% selang kepercayaan bagi 𝜃 diberikan dengan 𝜃̂𝐿 = 𝜃̂ − 𝑧𝛼⁄2 𝜎𝜃̂ dan 𝜃̂𝑈 = 𝜃̂ + 𝑧𝛼⁄2 𝜎𝜃̂ . ∎ Dengan cara yang sama, dapat ditentukan pula 100(1 − 𝛼)% batas kepercayaan satu sisi, yaitu 100(1 − 𝛼)% batas bawah bagi 𝜃 = 𝜃̂ − 𝑧𝛼 𝜎𝜃̂ . 100(1 − 𝛼)% batas atas bagi 𝜃 = 𝜃̂ + 𝑧𝛼 𝜎𝜃̂ . Contoh 2.23 Suatu supermarket mencatat waktu belanja 64 sampel acak dari konsumen yang datang. Rata-rata dan variansi dari ke-64 konsumen tersebut adalah 33 dan 256 menit. Tentukan penduga waktu rata- PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 45 rata setiap konsumen (µ) dengan koefisien kepercayaan dari 1 − 𝛼 = 0.9. Solusi: Diketahui: 𝑛 = 64, 𝑥̅ = 33 dan 𝑠 2 = 256. Variansi dari populasi tidak diketahui, maka digunakan s2 untuk menduga 𝜎 2 . Batas selang kepercayaan adalah 𝜃̂ ± 𝑧𝛼⁄2 𝜎𝜃̂ akan menjadi 𝑥̅ ± 𝑧𝛼⁄2 ( Dengan menggunakan 𝜎 𝑠 ) ≈ 𝑥̅ ± 𝑧𝛼⁄2 ( ) √𝑛 √𝑛 Tabel Z (terlampir), diperoleh 𝑧𝛼⁄2 = 𝑧0.05 = 1.645; oleh karena itu, batas kepercayaannya adalah 𝑠 𝑥̅ − 𝑧𝛼⁄2 ( 𝑛) = 33 − 1.645 ( √ 𝑠 𝑥̅ + 𝑧𝛼⁄2 ( 𝑛) = 33 + 1.645 ( √ 16 ) = 29.71l, √64 16 ) = 36.29. √64 Dengan demikian, selang kepercayaan bagi 𝜇 adalah (29.71,36.29). Dalam pengambilan sampel berulang, sekitar 90% dari semua selang yang berbentuk 𝑥̅ ± 1,645 (𝑠/√𝑛) akan memuat 𝜇, yaitu rata-rata sebenarnya dari waktu belanja setiap pelanggan. E. Konsistensi Penduga Definisi 2.36 Penduga 𝜃̂𝑛 dikatakan sebagai penduga konsisten bagi 𝜃 jika ∀𝜀 > 0, lim 𝑃(|𝜃̂𝑛 − 𝜃| ≤ 𝜀) = 1, 𝑛→∞ atau lim 𝑃(|𝜃̂𝑛 − 𝜃| > 𝜀) = 0. 𝑛→∞ PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 46 Teorema 2.9 Suatu penduga tak bias 𝜃̂𝑛 bagi 𝜃 adalah penduga konsisten bagi 𝜃 jika lim 𝑉(𝜃̂𝑛 ) = 0. 𝑛→∞ Bukti: Jika 𝑋 adalah sembarang variabel acak dengan 𝐸(𝑋) = 𝜇 dan 𝑉(𝑋) = 𝜎 2 < ∞ dan ∀𝑘 > 0, dapat digunakan Teorema Tchebysheff yang menyatakan bahwa 𝑃(|𝑋 − 𝜇| > 𝑘𝜎) ≤ 1 . 𝑘2 Bukti Teorema Tchebysheff terdapat pada buku Wackerly, et al. (2008). Mathematical Statistics with Applications. Seventh Edition. Duxbury: Thomson Brooks/Cole. Halaman: 208. Karena 𝜃̂𝑛 adalah penduga tak bias bagi 𝜃, itu menunjukkan bahwa 𝐸(𝜃̂𝑛 ) = 𝜃. Misalkan 𝜎𝜃̂𝑛 = √𝑉(𝜃̂𝑛 ) menotasikan galat standar bagi 𝜃̂𝑛 . Dengan menerapkan Teorema Tchebysheff untuk variabel acak 𝜃̂𝑛 , diperoleh: 𝑃(|𝜃̂𝑛 − 𝜃| > 𝑘𝜎𝜃̂𝑛 ) ≤ Misalkan 𝑛 adalah ukuran sampel, 𝜀 𝑘= , ∀𝜀 > 0, 𝜎𝜃̂𝑛 1 . 𝑘2 𝑘 > 0. Penerapan Teorema Tchebysheff untuk pemilihan nilai 𝑘 tersebut menunjukkan bahwa 𝑉(𝜃̂𝑛 ) 𝜀 1 𝑃(|𝜃̂𝑛 − 𝜃| > 𝜀) = 𝑃 (|𝜃̂𝑛 − 𝜃| > [ ] 𝜎𝜃̂𝑛 ) ≤ = . 2 𝜎𝜃̂𝑛 𝜀2 (𝜀 ⁄𝜎𝜃̂𝑛 ) Dengan demikian, 0 ≤ 𝑃(|𝜃̂𝑛 − 𝜃| > 𝜀) ≤ 𝑉(𝜃̂𝑛 ) . 𝜀2 Bila lim 𝑉(𝜃̂𝑛 ) = 0, maka untuk 𝑛 → ∞, 𝑛→∞ 𝑉(𝜃̂𝑛 ) = 0. 𝑛→∞ 𝜀 2 lim 0 ≤ lim 𝑃(|𝜃̂𝑛 − 𝜃| > 𝜀) ≤ lim 𝑛→∞ 𝑛→∞ PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 47 Dengan demikian, 𝜃̂𝑛 adalah penduga konsisten bagi 𝜃. ∎ Contoh 2.24 Misalkan 𝑋𝑖 adalah variabel acak berdistribusi Normal dengan 𝑖 = 1,2, . . 𝑛, ratarata 𝜇 dan variansi 𝜎 2 . Tunjukkan bahwa 𝑋̅ adalah penduga konsisten bagi 𝜇. Solusi: Akan diperiksa terlebih dahulu apakah 𝑋̅ merupakan penduga tak bias bagi 𝜇. 1 1 1 𝐸(𝑋̅) = 𝐸 ( ∑ 𝑋𝑖 ) = [𝐸(𝑋1 ) + 𝐸(𝑋2 ) + ⋯ + 𝐸(𝑋𝑛 )] = ∙ 𝑛𝜇 = 𝜇. 𝑛 𝑛 𝑛 Terbukti bahwa 𝑋̅ adalah penduga tak bias bagi 𝜇. Selanjutnya akan ditunjukkan bahwa 𝑋̅ adalah penduga konsisten bagi 𝜇. 1 1 𝑉(𝑋̅) = 𝑉 ( ∑ 𝑋𝑖 ) = 2 [𝑉(𝑋1 ) + 𝑉(𝑋2 ) + ⋯ + 𝑉(𝑋𝑛 )] 𝑛 𝑛 = 1 𝜎2 2 ∙ 𝑛𝜎 = . 𝑛2 𝑛 𝜎2 = 0. 𝑛→∞ 𝑛→∞ 𝑛 Jadi, terbukti bahwa 𝑋̅ adalah penduga konsisten bagi 𝜇. ∎ lim 𝑉(𝑋̅) = lim F. Metode Kemungkinan Maksimum (Maximum Likelihood Estimation Method/MLE) Salah satu metode dalam pendugaan parameter adalah metode Pendugaan Kemungkinan Maksimum (MLE). Sebagai contoh, misalkan terdapat sebuah kotak yang berisi tiga bola. Diketahui bahwa setiap bola berwarna merah atau putih, tetapi tidak diketahui banyaknya bola untuk setiap warna. Dipilih sampel secara acak dua bola tanpa pengembalian. Jika sampel acak menghasilkan dua bola merah, maka disimpulkan bahwa banyaknya bola merah pada kotak haruslah dua atau tiga. Jika terdapat dua bola merah dan satu bola putih pada kotak, maka peluang terpilihnya dua bola merah secara acak adalah (22)(10) (32) 1 = . 3 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 48 Di sisi lain ketika ketiga bola berwarna merah, maka peluang terpilihnya tiga bola merah secara acak adalah (32) (32) = 1. Oleh karena itu, dipilih tiga bola merah sebagai penduga dari banyaknya bola merah di dalam kotak karena nilai dugaan ini merupakan penduga yang memaksimumkan probabilitas dari sampel yang diamati. Hal ini jika dibandingkan dengan dua bola merah, tiga bola merah mempunyai probabilitas 1 yang lebih besar, yaitu 1 > 3. Tentu saja kemungkinan terdapat dua bola merah pada kotak juga benar, tetapi hasil yang diamati memberikan kepercayaan yang lebih untuk tiga bola merah di dalam kotak. Contoh tersebut mengilustrasikan sebuah metode untuk menemukan sebuah penduga yang dapat diaplikasikan pada berbagai situasi. Secara teknis, metode ini disebut Metode Kemungkinan Maksimum. Metode tersebut diperkenalkan pertama kali oleh R. A. Fisher (1912) yang menghasilkan penduga yang sangat baik bagi parameter 𝜃 untuk sampel berukuran besar. Definisi 2.37 Diberikan pengamatan saling bebas 𝑥1 , 𝑥2 , … , 𝑥𝑛 yang merupakan variabel acak kontinu berukuran 𝑛 dengan fungsi probabilitas 𝑓(𝑥|𝜃) dan 𝜃 adalah parameter yang tidak diketahui. Misalkan fungsi kemungkinan tergantung pada 𝑘 buah parameter, yaitu 𝜃1 , 𝜃2 , … , 𝜃𝑘 , maka tujuan dari metode kemungkinan maksimum adalah untuk menentukan penduga dari 𝜃 yang memaksimumkan fungsi likelihood 𝑛 𝐿(𝑥1 , 𝑥2 , … , 𝑥𝑛 |𝜃1 , 𝜃2 , … , 𝜃𝑘 ) = 𝑓(𝑥|𝜃) = ∏ 𝑓(𝑥𝑖 ; 𝜃). 𝑖=1 Terkadang sulit untuk mencari turunan fungsi likelihood, maka yang dilakukan adalah menentukan nilai maksimum dari fungsi log-likelihood. Fungsi log-likelihood dapat ditulis dalam bentuk: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 49 𝑙 = ln 𝐿(𝜃). Nilai parameter 𝜃 dapat diperoleh dengan memaksimumkan fungsi loglikelihood. Hal tersebut dilakukan dengan mencari turunan parsial pertama dari fungsi log-likelihood-nya terhadap setiap parameternya. Sehingga, MLE 𝜃̂ merupakan penyelesaian dari persamaan berikut: 𝜕𝑙 = 0. 𝜕𝜃 Misalkan terdapat 𝑘 buah parameter yang tidak diketahui, maka pendugaan parameter 𝜃𝑖 dengan Metode Kemungkinan Maksimum adalah 𝜕𝑙 = 0, 𝜕𝜃𝑖 dengan 𝑙 = ln(𝜃1 , 𝜃2 , … , 𝜃𝑘 ), 𝑖 = 1,2, … , 𝑘. Contoh 2.25 Misalkan 𝑥1 , 𝑥2 , … , 𝑥𝑛 adalah sampel acak berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎 2 . Temukanlah 𝜇̂ dan 𝜎̂ 2 dengan menggunakan Metode Kemungkinan Maksimum. Solusi: Karena 𝑥1 , 𝑥2 , … , 𝑥𝑛 adalah sampel acak kontinu berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎 2 , maka fungsi probabilitasnya didefinisikan sebagai 𝑓(𝑥) = 1 𝜎√2𝜋 exp [(− 1 ) (𝑥 − 𝜇)2 ] , 2𝜎 2 − ∞ < 𝑥 < ∞. Berdasarkan Definisi MLE, diperoleh 𝐿(𝜇, 𝜎 2 ) = 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 |𝜇, 𝜎 2 ) = 𝑓(𝑥1 |𝜇, 𝜎 2 ) × 𝑓(𝑥2 |𝜇, 𝜎 2 ) × … × 𝑓(𝑥𝑛 |𝜇, 𝜎 2 ) =[ 1 𝜎√2𝜋 exp ( −(𝑥1 − 𝜇)2 1 −(𝑥𝑛 − 𝜇)2 )] × … × [ exp ( )] 2𝜎 2 2𝜎 2 𝜎√2𝜋 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 50 𝑛 𝑛 1 2 1 =( ) exp [− 2 ∑(𝑥𝑖 − 𝜇)2 ]. 2 2𝜋𝜎 2𝜎 𝑖=1 Fungsi log-likelihood dari persamaan di atas adalah 𝑛 𝑛 1 2 1 ln[𝐿(𝜇, 𝜎 2 )] = ln {( ) exp [− 2 ∑(𝑥𝑖 − 𝜇)2 ]} 2 2𝜋𝜎 2𝜎 𝑖=1 𝑛 𝑛 1 1 = [ln ( )] − 2 ∑(𝑥𝑖 − 𝜇)2 2 2 2𝜋𝜎 2𝜎 𝑖=1 𝑛 𝑛 𝑛 1 = − ln(𝜎 2 ) − ln(2𝜋) − 2 ∑(𝑥𝑖 − 𝜇)2 2 2 2𝜎 𝑖=1 Penduga kemungkinan maksimum dari 𝜇 dan 𝜎 2 adalah penduga yang memaksimumkan ln[𝐿(𝜇, 𝜎 2 )] dengan mencari nilai turunan parsial terhadap 𝜇 dan 𝜎 2 , maka diperoleh 𝑛 1 𝜕 ln[𝐿(𝜇, 𝜎 2 )] = 2 ∑(𝑥𝑖 − 𝜇) 𝜎 𝜕𝜇 𝑖=1 𝑛 𝑛 1 𝜕 ln[𝐿(𝜇, 𝜎 2 )] = − 2 + 4 ∑(𝑥𝑖 − 𝜇)2 2 2𝜎 2𝜎 𝜕𝜎 𝑖=1 Jika turunan parsial terhadap 𝜇 dan 𝜎 2 disamakan dengan nol, maka diperoleh: 𝑛 1 ∑(𝑥𝑖 − 𝜇) = 0 𝜎2 𝑖=1 𝑛 ∑(𝑥𝑖 − 𝜇) = 0 𝑖=1 𝑛 ∑ 𝑥𝑖 − 𝑛𝜇 = 0 𝑖=1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 51 𝜇 = ∑𝑛𝑖=1 𝑥𝑖 = 𝑥̅ 𝑛 𝑛 𝑛 1 − 2 + 4 ∑(𝑥𝑖 − 𝜇)2 = 0 2𝜎 2𝜎 𝑖=1 𝑛 𝑛 1 ∑(𝑥𝑖 − 𝜇)2 = 2 4 2𝜎 2𝜎 𝑖=1 𝑛 1 ∑(𝑥𝑖 − 𝜇)2 = 𝑛 𝜎2 𝑖=1 𝑛 𝜎 1 = ∑(𝑥𝑖 − 𝜇)2 . 𝑛 2 𝑖=1 Dengan substitusi 𝜇 = 𝑥̅ ke persamaan, diperoleh 1 𝜎 2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 . 𝑛 Jadi, penduga kemungkinan maksimum untuk 𝜇 dan 𝜎 2 adalah 1 𝜇 = 𝑥̅ dan 𝜎 2 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 . G. Pencilan 1. Definisi Pencilan Pencilan seringkali ada di dalam proses pengolahan data. Banyak peneliti menganggap bahwa pencilan akan menjadikan pendugaan terjadi kesalahan (error), sehingga diperlukan pendeteksian pencilan. Definisi yang tepat dari pencilan sering tergantung pada asumsi data dan metode deteksi yang diterapkan. Namun, beberapa definisi dianggap cukup untuk berbagai jenis data dan metode. Hawkins (1980) mendefinisikan pencilan sebagai satu atau lebih pengamatan yang nilainya menyimpang jauh dari pengamatan lain yang menimbulkan kecurigaan bahwa pengamatan dihasilkan oleh mekanisme yang berbeda. Barnet dan Lewis (1994) mendefinisikan pencilan sebagai suatu pengamatan yang PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 52 menyimpang dengan sangat mencolok dari anggota sampel lainnya. Johnson (1992) mendefinisikan pencilan sebagai pengamatan dalam kumpulan data yang tampaknya tidak konsisten dengan kumpulan data lainnya. Ferguson (1961), pencilan adalah data yang menyimpang dari sekumpulan data yang lain. R. K. Sembiring (1950) mendefinisikan pencilan dalam konteks analisis regresi, yaitu pengamatan yang jauh dari pusat data yang mungkin berpengaruh besar terhadap koefisien regresi. Dilihat dari beberapa definisi tersebut, dapat disimpulkan bahwa pencilan adalah pengamatan yang nilainya menyimpang jauh dari kumpulan data/pengamatan lainnya. Contoh 2.26 Sebuah toko mempunyai rincian banyaknya barang yang terjual beserta harganya yang disajikan dalam Tabel 2.3. Dengan 𝑋 = banyaknya buku yang terjual dan 𝑌 = harga barang (dalam ribuan). Tabel 2.3. Banyaknya barang yang terjual dan harga barang Pengamatan 1 2 3 4 5 6 7 X 19 17 14 11 18 35 9 Y 792 807 812 829 835 850 855 Dengan menggambar grafik nilai Y terhadap nilai X, akan terlihat apakah data tersebut memuat pencilan atau tidak, sehingga diperoleh: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 53 860 Y 840 820 800 780 0 10 20 30 40 X Gambar 2.6. Harga Barang terhadap Banyaknya Barang yang Terjual Berdasarkan Gambar 2.6 terlihat bahwa pengamatan ke-6 jauh di atas pengamatan yang lain pada umumnya. Hal ini diperkuat dengan letak titik pada grafik yang mencolok pada data pengamatan ke-6, sehingga data tersebut bila dibandingkan dengan data lainnya memiliki perbedaan yang sangat signifikan dan dapat diduga sebagai pencilan. Contoh 2.27 Pada penelitian Badan Pusat Statistik (BPS) Provinsi D. I. Yogyakarta telah diperoleh data produksi hasil hutan rimba menurut jenisnya pada tahun 2001-2015 yang disajikan dalam tabel berikut: Tabel 2.4. Produksi Hasil Hutan Rimba (Kayu Pertukangan) Menurut Jenisnya di Provinsi D. I. Yogyakarta Produksi No Tahun Hasil Hutan Produksi No Tahun (m3) Hasil Hutan (m3) 1 2001 600.95 9 2009 1120.62 2 2002 52.78 10 2010 174.66 3 2003 36.36 11 2011 35.59 4 2004 20.16 12 2012 63.72 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 54 Produksi No Tahun Hasil Hutan Produksi No Tahun (m3) Hasil Hutan (m3) 5 2005 54.89 13 2013 195.65 6 2006 17.76 14 2014 266.66 7 2007 5.10 15 2015 14.50 8 2008 1120.62 Sumber: BPS Provinsi D. I. Yogyakarta www.yogyakarta.bps.go.id/linkTabelStatis/view/id/49 Dengan menggambar grafik produksi hasil hutan rimba terhadap waktu, akan terlihat apakah data tersebut mengandung data pencilan atau Produksi Hasil Hutan (m3) tidak, sehingga diperoleh 1200 1000 800 600 400 200 0 2001 2003 2005 2007 2009 2011 2013 2015 Tahun Gambar 2.7. Produksi Hasil Hutan Rimba Terhadap Waktu Berdasarkan Gambar 2.7 terlihat bahwa data tahun 2001, 2008 dan 2009 jauh di atas data yang lain pada umumnya. Hal ini diperkuat dengan letak titik pada grafik yang mencolok pada data tahun 2001, 2008 dan 2009, sehingga data tersebut bila dibandingkan dengan data lainnya memiliki perbedaan yang sangat signifikan dan dapat diduga sebagai pencilan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 55 2. Pengaruh Pencilan Data pengamatan yang mengandung pencilan akan mengganggu proses analisis data. Keberadaan pencilan dapat berpengaruh pada proses perhitungan statistik yang akan berdampak pada hasil kesimpulan. Melalui data pengamatan, diperoleh informasi-informasi penting yang dapat membantu proses perhitungan. Informasi tersebut dapat berupa rata-rata. Pada contoh 2.26 diperoleh rata-rata dari keseluruhan pengamatan sebesar 825.7143. Di sisi lain, jika pengamatan yang merupakan pencilan (pengamatan ke-6) tidak diikutsertakan dalam proses perhitungan rata-rata, maka diperoleh rata-rata sebesar 821.667. Pada contoh berikutnya (contoh 2.27) akan dicari pula rata-rata data. Diperoleh rata-rata dari keseluruhan pengamatan sebesar 252.0013. Apabila pengamatan yang merupakan pencilan (pengamatan tahun 2001, 2008, dan 2009) tidak diikutsertakan dalam perhitungan, maka diperoleh rata-rata sebesar 78.1525. Hal ini terlihat bahwa dari kedua contoh tersebut menunjukkan adanya perbedaan antara rata-rata keseluruhan pengamatan dalam data dengan rata-rata data yang dihitung tanpa mengikutsertakan pencilan. Jadi, keberadaan pencilan dapat memberikan perbedaan pada perhitungan/hasil analisis data. Perbedaan yang terjadi akibat meningkatnya pendugaan variansi (pengukuran semakin meluas), selang data menjadi lebar dan rata-rata yang dihitung tidak dapat menunjukkan nilai yang sebenarnya (bias). Seringkali pencilan dihilangkan/dihapuskan untuk meningkatkan akurasi dari pendugaan. Akan tetapi dalam praktiknya, hal tersebut tidak dianjurkan karena terkadang pencilan dapat memiliki informasi yang sangat berguna. Kehadiran data pencilan dapat menunjukkan individu atau kelompok yang memiliki perilaku/nilai sangat berbeda dari situasi standar dibanding dengan kumpulan pengamatan yang lain pada data. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 56 3. Pendeteksian Pencilan 3.1. Metode Grafis Pencilan dapat dilihat berdasarkan grafis (gambar). Dengan memplot data penelitian ke-i (i=1,2,…,n) dengan n adalah banyaknya data penelitian, dapat diketahui data tersebut memuat pencilan atau tidak. Apabila terdapat satu atau beberapa data yang terletak jauh dari pola grafis pada kumpulan data keseluruhan, maka hal ini dapat diidentifikasi bahwa data mengandung pencilan. Metode ini mempunyai keuntungan, yaitu sangat mudah dipahami karena tidak perlu menggunakan perhitungan rumit untuk mencari pencilan, serta tampilannya yang menarik karena menampilkan data secara grafis. Di sisi lain, terdapat pula kelemahan melalui metode ini, yaitu keputusan bahwa suatu data disebut pencilan sangat bergantung pada subyektivitas peneliti. Hal ini dikarenakan hanya mengandalkan visualisasi grafis dan untuk itu dibutuhkan seseorang yang ahli dan berpengalaman dalam menginterpretasikan grafis tersebut. Untuk lebih jelasnya, akan diperlihatkan identifikasi data pencilan yang terdapat pada contoh berikut. Contoh 2.28 Dalam suatu penelitian diketahui data jumlah wisatawan mancanegara dan pengunjung asing yang masuk melalui pintu Makassar pada tahun 2007 yang disajikan dalam tabel berikut. Tabel 2.5. Jumlah wisatawan yang masuk melalui pintu Makassar No Bulan X No Bulan X 1 Januari ‘07 187 11 November 383 2 Februari 989 12 Desember 246 3 Maret 741 13 Januari ‘08 228 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 57 No Bulan X No Bulan X 4 April 78 14 Februari 79 5 Mei 154 15 Maret 94 6 Juni 36 16 April 78 7 Juli 178 17 Mei 67 8 Agustus 99 18 Juni 112 9 September 323 19 Juli 430 10 Oktober 88 Keterangan: X adalah jumlah wisman dan pengunjung asing Sumber: Ditjen Imigrasi, BPS dan Angkasa Pura I dan II Diolah kembali oleh Pusat Pengelolaan Data dan Sistem Jaringan www.budpar.go.id Dengan menguji data menggunakan metode grafis akan terlihat apakah data tersebut mengandung data pencilan atau tidak, Wisman & Pengunjung Asing sehingga diperoleh: 1200 1000 800 600 400 200 0 0 5 10 15 20 Bulan Gambar 2.8. Scatter-plot Jumlah Wisman dan Pengunjung Asing Berdasarkan Gambar 2.8 terlihat bahwa pengamatan bulan Februari dan Maret 2007 jauh di atas pengamatan yang lain pada umumnya, sehingga dapat diprediksi sebagai pencilan. Bila dibandingkan PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 58 dengan pengamatan bulan Februari dan Maret 2008, terlihat pengamatan bulan Februari dan Maret 2007 memiliki perbedaan yang sangat signifikan. Hal ini dapat diduga sebagai pencilan. 3.2. Diagram Kotak Garis (Boxplot) John Tukey (1977) memperkenalkan beberapa metode untuk penyelidikan analisis data, salah satunya adalah metode Boxplot. Sebuah Boxplot adalah grafik yang menyajikan median (𝑄2 ), kuartil pertama (𝑄1) dan kuartil ketiga (𝑄3 ), serta setiap pencilan yang termuat di dalam sampel. Melalui Boxplot dapat menunjukkan ada/tidaknya nilai ekstrim dari data pengamatan. Perhatikan bahwa 75% dari data adalah kurang dari kuartil ketiga dan 25% adalah kurang dari kuartil pertama, hal berikut bahwa 50%, atau setengah data berada di antara kuartil pertama dan ketiga. Oleh karena itu, selang interkuartil (𝐼𝑄𝑅) adalah perbedaan antara kuartil pertama dan kuartil ketiga. Jika 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 akan mewakili selang interkuartil, maka untuk menggambar Boxplot, untuk setiap titik yang lebih dari 1.5 IQR di atas kuartil ketiga, atau lebih dari 1.5 IQR di bawah kuartil pertama, dianggap pencilan. Kerangka Boxplot terdiri dari: sebuah kotak memanjang dari kiri ke kanan, sisi bawah kotak adalah 𝑄1 dan sisi atas adalah 𝑄3 ; sebuah garis horizontal yang ditarik dari median; serta whiskers yang memanjang dari atas dan bawah kotak, yaitu dari 𝑄1 dan 𝑄3 . Biasanya, whiskers secara signifikan lebih panjang dibandingkan kotak. Whiskers yang pendek dapat diidentifikasi sebagai distribusi seragam dengan titik-titik perhentian yang ekstrim. Terdapat dua tipe pencilan yang terkenal, yaitu: pencilan ringan (mild outliers) dan pencilan ekstrim (extreme outliers). Suatu pengamatan 𝑥 disebut sebagai pencilan ekstrim, jika berada di luar selang (𝑄1 − 3 × 𝐼𝑄𝑅, 𝑄3 + 3 × 𝐼𝑄𝑅). Perhatikan bahwa pusat dari selang adalah (𝑄1 + 𝑄3 )⁄2 dan jangkauannya adalah 3.5 × 𝐼𝑄𝑅. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 59 Suatu pengamatan 𝑥 disebut sebagai pencilan ringan jika berada di luar selang (𝑄1 − 1.5 × 𝐼𝑄𝑅, 𝑄3 + 1.5 × 𝐼𝑄𝑅). Angka 1.5 dan 3 dipilih dari perbandingan dengan distribusi Normal. Untuk sampel besar dari populasi berdistribusi Normal, kuartil harus dekat dengan 𝜇 ± 0.67𝜎. Dengan demikian, selang bagian dalam harus dekat dengan 𝜇 ± 2.67𝜎 dan selang bagian luar dekat dengan 𝜇 ± 4.67𝜎. Dapat disimpulkan bahwa, jika populasi berdistribusi Normal, hanya sekitar 0.8% data akan ditemukan di luar selang bagian dalam. Pencilan-pencilan diduga sebagai bukti dari kumpulan data yang terkontaminasi, dapat menjadi bukti bahwa populasi memiliki distribusi tidak Normal, atau diduga muncul dalam sampel dari populasi berdistribusi Normal. Untuk ukuran sampel yang kecil, diharapkan data ekstrim yang lebih sedikit. Jika yang diambil hanyalah sampel kecil, maka lebih cenderung untuk mendapatkan 𝐼𝑄𝑅 yang tidak dapat mewakili yang kecil, sehingga menghasilkan selang yang sempit. Ketika ini terjadi, kemungkinan besar bahwa data akan ditandai sebagai pencilan, kecuali untuk 𝑁 kecil dan distribusi tunggal, perhitungan probabilitas yang tepat adalah mustahil. Di bawah ini diperlihatkan anatomi dari Boxplot beserta cara penentuan batas-batasnya. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 60 𝑥 Data titik terbesar dari 1.5 IQR di atas 𝑄3 𝑄3 𝑄2 Pencilan 𝑄1 Data titik terbesar dari 1.5 IQR di bawah 𝑄1 𝑥 𝑥 Gambar 2.9. Anatomi dari Boxplot Langkah-langkah pembuatan Boxplot: 1) Hitunglah median, kuartil pertama dan ketiga dari sampel. Tunjukkan ini dengan garis horisontal. Gambar garis vertikal untuk menyelesaikan kotak. 2) Cari nilai sampel terbesar yang tidak lebih dari 1.5 IQR di atas kuartil ketiga, dan nilai sampel terkecil yang tidak lebih dari 1.5 IQR di bawah kuartil pertama. Perpanjang garis vertikal (whiskers) dari garis-garis kuartil menuju ke titik nilai tersebut. 3) Nilai yang lebih dari 1.5 IQR di atas kuartil ketiga, atau lebih dari 1.5 IQR di bawah kuartil pertama, tetapkan itu sebagai pencilan. Gambarlah setiap pencilan secara satu per satu. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 61 Contoh 2.29 Tabel 2.6. Durasi (dalam menit) periode aktif dari Geyser Old Faithful 42 45 49 50 51 51 51 51 53 53 55 55 56 56 57 58 60 66 67 67 68 69 70 71 72 73 73 74 75 75 75 75 76 76 76 76 76 79 79 80 80 80 80 81 82 82 82 83 83 84 84 84 85 86 86 86 88 90 91 93 Berikut adalah gambar Boxplot yang diperoleh berdasarkan data Gambar 2.10. Boxplot Contoh 2.29 Gambar 2.10 menyajikan Boxplot untuk data yang disajikan pada Tabel 2.6. Catatan pertama bahwa tidak ada pencilan dalam data tersebut. Dengan membandingkan empat bagian Boxplot, dapat dikatakan bahwa nilai-nilai sampel relatif dekat antara median dan kuartil ketiga, serta lebih jauh antara median dan kuartil pertama. Whiskers bawah adalah sedikit lebih jauh dari yang atas, ini menunjukkan bahwa data memiliki bagian yang sedikit lebih panjang dan lebih rendah dari bagian atas. Oleh karena jarak antara median dan kuartil pertama lebih jauh dari PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 62 jarak antara median dan kuartil ketiga, maka seperempat data yang rendah menghasilkan whiskers yang lebih panjang dibandingkan dengan seperempat yang paling atas. Boxplot ini menunjukkan bahwa data tidak simetris ke kiri. Contoh 2.30 Tabel 2.7 memberikan informasi tentang ukuran ketebalan dalam ̇ , dari lapisan oksida untuk 24 wafers (Navidi, 2011: angstrom (𝐴) 36). Sembilan kali pengukuran dilakukan pada setiap wafer. Wafers tersebut diproduksi di dalam dua pengukuran secara terpisah dengan 12 wafers berada di dalam setiap pengukuran. Kedua belas wafers di dalam setiap pengukuran terdiri dari beberapa jenis yang berbeda dan diproses dalam beberapa lokasi tungku yang berbeda. Tujuan dalam mengumpulkan data adalah untuk menentukan apakah ketebalan lapisan oksida salah satunya dipengaruhi oleh jenis wafer atau lokasi tungku. Oleh karena itu, hal yang menjadi sorotan dalam percobaan ini adalah jenis wafer dan lokasi tungku sebagai faktor-faktornya, dan ketebalan lapisan oksida sebagai hasilnya. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 63 Tabel 2.7. Ketebalan Lapisan Oksida Bagi Silicon Wafers Wafer Penilaian 1 Ketebalan 1 90.0 92.2 94.9 92.7 91.6 88.2 92.0 98.2 96.0 2 91.8 94.5 93.9 77.3 92 89.9 87.9 92.8 93.3 3 90.3 91.1 93.3 93.5 87.2 88.1 90.1 91.9 94.5 4 92.6 90.3 92.8 91.6 92.7 91.7 89.3 95.5 93.6 5 91.1 89.8 91.5 91.5 90.6 93.1 88.9 92.5 92.4 6 76.1 90.2 96.8 84.6 93.3 95.7 90.9 100.3 95.2 7 92.4 91.7 91.6 91.1 88.0 92.4 88.7 92.9 92.6 8 91.3 90.1 95.4 89.6 90.7 95.8 91.7 97.9 95.7 9 96.7 93.7 93.9 87.9 90.4 92.0 90.5 95.2 94.3 10 92.0 94.6 93.7 94 89.3 90.1 91.3 92.7 94.5 11 94.1 91.5 95.3 92.8 93.4 92.2 89.4 94.5 95.4 12 91.7 97.4 95.1 96.7 77.5 91.4 90.5 95.2 93.1 Wafer Penilaian 2 Ketebalan 1 93.0 89.9 93.6 89 93.6 90.9 89.8 92.4 93.0 2 91.4 90.6 92.2 91.9 92.4 87.6 88.9 90.9 92.8 3 91.9 91.8 92.8 96.4 93.8 86.5 92.7 90.9 92.8 4 90.6 91.3 94.9 88.3 87.9 92.2 90.7 91.3 93.6 5 93.1 91.8 94.6 88.9 90.0 97.9 92.1 91.6 98.4 6 90.8 91.5 91.5 91.5 94.0 91.0 92.1 91.8 94.0 7 88.0 91.8 90.5 90.4 90.3 91.5 89.4 93.2 93.9 8 88.3 96.0 92.8 93.7 89.6 89.6 90.2 95.3 93.0 9 94.2 92.2 95.8 92.5 91.0 91.4 92.8 93.6 91.0 10 101.5 103.1 103.2 103.5 96.1 102.5 102 106.7 105.4 11 92.8 90.8 92.2 91.7 89.0 88.5 87.5 93.8 91.4 12 92.1 93.4 94.0 94.7 90.8 92.1 91.2 92.3 91.1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 64 Solusi: Langkah pertama dalam analisis ini adalah membuat sebuah Boxplot untuk data di masing-masing penilaian untuk membantu menentukan apakah ditemukan pencilan dan apakah salah satu pengamatan harus dihapus? Hasil Boxplot disajikan pada Gambar 2.11. Gambar 2.11. Perbandingan Boxplot untuk Data Ketebalan Lapisan Oksida Boxplot menunjukkan bahwa ada beberapa pencilan dalam setiap pengukuran. Perhatikan bahwa selain dari pencilan ini, tidak ada perbedaan yang mencolok antara sampel, dan karena itu tidak ada bukti perbedaan secara sistematis antarpengukuran. Langkah berikutnya adalah memeriksa pencilan, jika ada, harus dihapus. Dengan memeriksa data tersebut, dapat dilihat bahwa sembilan pengukuran terbesar berada di dalam pengukuran 2 yang terjadi pada wafer ke-10. Hal itu kemudian ditetapkan bahwa wafer tersebut telah terkontaminasi dengan residual film, yang menyebabkan pengukuran ketebalan besar. Oleh karena itu, akan sesuai untuk PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 65 menghapus pengukuran ini. Dalam pengukuran 1, telah ditemukan tiga pengukuran terkecil yang disebabkan oleh rusaknya alat pengukuran ketebalan, dan karena itu tepat dihapus. Akan tetapi, tidak adanya alasan yang kuat untuk dua pencilan yang tersisa dalam pengukuran 1, sehingga dapat dimasukkan dalam analisis. 3.3. Uji Grubbs Uji ini digunakan untuk mendeteksi pencilan pada suatu waktu dalam kumpulan data univariat. Hal ini didasarkan pada asumsi Normalitas. Artinya bahwa sebelum menerapkan uji Grubbs, data harus cukup dekat dengan distribusi Normal. Jika sampel diselidiki berdistribusi lainnya, maka uji ini memberikan hasil yang tidak sebenarnya. Uji ini didasarkan pada perbedaan rata-rata sampel dan data yang paling ekstrim dengan mempertimbangkan standar deviasi (Grubbs, 1950, 1969; DIN 32645; DIN 38402). Definisi 2.38 Statistik uji Grubbs diberikan dengan maks|𝑋𝑖 − 𝑋̅| 𝑠 dengan 𝑋𝑖 adalah pengamatan ke-𝑖, 𝑋̅ dan 𝑠 adalah rata-rata dan 𝐺= standar deviasi sampel. (Dan, E. D., and Ijeoma, O. A., 2013: 11) Langkah-langkah Pengujian Hipotesis 1) H0 : Pengamatan ke-𝑖 bukan pencilan 2) H1 : Pengamatan ke-𝑖 merupakan pencilan PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 66 3) Asumsi: Data Pengamatan Berdistribusi Normal Statistik Uji: 𝐺= maks|𝑋𝑖 − 𝑋̅| , 𝑖 = 1. . , 𝑛 𝑠 4) Wilayah Kritis: H0 ditolak jika 𝐺 > (𝑛−1) √𝑛 𝑡2 ⁄ (𝛼 𝑛,𝑛−2) √𝑛−2+𝑡 , 2 (𝛼⁄𝑛,𝑛−2) dengan 𝑛 adalah ukuran sampel, 𝑡(𝛼⁄𝑛,𝑛−2) adalah nilai kritis dari distribusi 𝑡 dengan derajat bebas (𝑛 − 2) dan tingkat signifikansi dari (𝛼 ⁄𝑛). 5) Perhitungan 6) Kesimpulan Contoh 2.31 Diketahui data penelitian sebagai berikut Tabel 2.8. Data Boiler 1200 2566 3120 3728 4206 6500 1206 2635 3137 3748 4268 6565 1515 2680 3163 3775 4526 6928 1965 2735 3211 4006 5651 7606 2048 2974 3698 4065 6454 14791 2000 2972 3590 4023 6387 10825 Temukanlah pencilan di dalam data Boiler tersebut. Solusi: Dengan menggunakan Program R (lampiran 1), diperoleh data ke30 dan 36, yaitu 14791 dan 10825 terdeteksi sebagai pencilan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 67 3.4. Uji MAD (Median Absolute Deviation) Pengujian ini dilakukan untuk mendeteksi adanya pencilan dalam suatu kumpulan data yang diteliti. Definisi 2.39 (Huber, 1981) MAD didefinisikan sebagai berikut: MAD = 𝑏𝑥̃𝑖 (|𝑥𝑖 − 𝑥̃𝑗 (𝑥𝑗 )|) dengan 𝑥̃𝑗 (𝑥𝑗 ) adalah median dari 𝑛 pengamatan, 𝑥𝑖 adalah pengamatan terurut, 𝑥̃𝑖 (|𝑥𝑖 − 𝑥̃𝑗 (𝑥𝑗 )|) adalah median dari 𝑛 nilai mutlak dari (𝑥𝑖 − 𝑥̃𝑗 (𝑥𝑗 )). (Rousseeuw dan Croux, 1993) Nilai 𝑏 adalah sebuah konstanta yang terkait dengan asumsi Normalitas atau ketidaknormalan yang disebabkan oleh pencilan. Nilai 𝑏 dapat diperoleh dari 𝑏 = 1/𝑄(0.75), dengan 𝑄(0.75) adalah kuartil 0.75 dari distribusi yang diasumsikan. Dalam kasus Normalitas, nilai 𝑏 = 1/𝑄(0.75) = 1.4826 (Huber, 1981). Dalam pengujian menggunakan MAD harus ditentukan terlebih dahulu kriteria penolakan suatu nilai. Miller (1991) mengusulkan beberapa nilai, yaitu 3 (sangat konservatif), 2.5 (cukup konservatif) atau 2 (kurang konservatif). Misalkan dipilih batas tepi dengan nilai 3, maka kriteria keputusan menjadi: 𝑥̃ − 3 × MAD < 𝑥𝑖 < 𝑥̃ + 3 × MAD atau 𝑥𝑖 −𝑥̃ MAD > | ± 3|, dengan 𝑥̃ adalah median dari data pengamatan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 68 Langkah-langkah Pengujian Hipotesis 1) H0 : Pengamatan ke-𝑖 bukan pencilan 2) H1 : Pengamatan ke-𝑖 merupakan pencilan 3) Asumsi: Data Pengamatan Berdistribusi Normal Statistik Uji: 𝑥𝑖 − 𝑥̃ , MAD dengan 𝑥̃ adalah median dari data pengamatan 4) Wilayah Kritis: H0 ditolak jika 𝑥𝑖 ∉ (𝑥̃ − 3 × MAD, 𝑥̃ + 3 × MAD) atau 𝑥𝑖 − 𝑥̃ < | ± 3| MAD 5) Perhitungan 6) Kesimpulan Uji ini akan diaplikasikan pada contoh 3.8 dalam bab 3. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB III SELANG KEPERCAYAAN ROBUST A. Statistika Robust Bidang statistika robust menjadi penting dalam beberapa dekade terakhir. Banyak peneliti menggunakan metode statistik 𝑟𝑜𝑏𝑢𝑠𝑡 yang klasik dan pengembangan teori komprehensif dari kekekaran (𝑟𝑜𝑏𝑢𝑠𝑡𝑛𝑒𝑠𝑠), karena ada keuntungan dari statistik 𝑟𝑜𝑏𝑢𝑠𝑡. Dengan digunakannya metode robust, hasil yang diharapkan meskipun dalam kondisi yang tidak ideal (seperti variansi data terlalu besar dan terdapat pencilan) akan tetap akurat. Banyak ahli statistik mengatakan bahwa analisis data statistik harus selalu mempertimbangkan aspek "𝑟𝑜𝑏𝑢𝑠𝑡". Apa yang dimaksud " 𝑟𝑜𝑏𝑢𝑠𝑡"? Menurut Kamus Oxford, kata robust dapat didefinisikan sebagai berikut. (a) (of an object) study in construction. ‘a robust metal cabinet’ (b) (of a system, organization, etc.) able to withstand or overcome adverse conditions. ‘the country's political system has continued to be robust in spite of its economic problems’ (c) Uncompromising and forceful. ‘he took quite a robust view of my case’ Berdasarkan ketiga definisi tersebut, dapat disimpulkan bahwa robust adalah kata sifat yang berarti kekar, kuat, atau kokoh. Diharapkan dengan statistik robust inilah suatu data dapat tetap kekar walaupun ada faktor-faktor pengganggu yang terdapat di dalam suatu data, misalnya pengamatan pencilan. Asumsi Normalitas, saling bebas, dan linearitas sering tidak terpenuhi dalam analisis data. Penduga dan uji statistik yang didasarkan pada asumsi-asumsi tersebut akan memberikan hasil yang bias, tergantung pada "besarnya" penyimpangan dan "sensitivitas" dari prosedur yang ada. Untuk mendapatkan hasil 69 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 70 yang dapat diandalkan, teori statistik diperlukan untuk jenis penyimpangan model parametrik. Statistik nonparametrik membolehkan berbagai variasi distribusi probabilitas, sehingga asumsi distribusi Normal tidak lagi relevan. Namun, ada juga asumsi yang harus dipenuhi dalam statistik nonparametrik, seperti simetri dan kontinuitas mutlak. Penyimpangan dari prasyarat ini menyebabkan hasil yang bias dan terdistorsi. Sifat robust di dalam statistika umumnya menunjukkan ketidaksensitivan pada penyimpangan di sekitar suatu model probabilistik yang mendasari (Hoaglin, et al: 2). Statistik robust dapat dilihat sebagai pendekatan terhadap teori pendugaan model parametrik. Statistik yang robust adalah cara tepat untuk meringkas hasil, ketika diduga ada sebagian kecil dalam data yang merupakan pencilan. Sebagian besar penduga parameter lokasi (misalnya, rata-rata) dan parameter skala (misalnya, standar deviasi) tergantung pada asumsi implisit, misalnya data merupakan sampel acak berdistribusi Normal. Tetapi, diketahui bahwa data analitik seringkali bermula dari suatu model. Distribusi dari suatu data seringkali berbentuk sangat miring dan terkadang memuat pencilan. B. Pengujian Robustness Kurva Sensitivitas Kurva sensitivitas menunjukkan pengaruh nilai tambahan pada suatu pengamatan terhadap penduga. Misalkan ada sebuah penduga yang didefinisikan untuk sampel yang berukuran sembarang 𝑛. Untuk sampel yang berukuran 𝑛 − 1 dengan variabel acak 𝑥1 , … , 𝑥𝑛−1 akan menduga 𝑇𝑛−1 (𝑥1 , … , 𝑥𝑛−1 ). Perubahan nilai dugaan terjadi ketika adanya suatu nilai yang sama dengan 𝑥 dari sebuah pengamatan ke-𝑛, yaitu 𝑇𝑛 (𝑥1 , … , 𝑥𝑛−1 , 𝑥) − 𝑇𝑛−1 (𝑥1 , … , 𝑥𝑛−1 ). Kita dapat membuat perbandingan ukuran sampel dengan mempertimbangkan perubahan secara proporsional dalam ukuran sampel. Kita bagi perubahan nilai dugaan dengan 1/𝑛 atau ekuivalen dengan mengalikannya dengan 𝑛. Hasilnya berupa kurva sensitivitas. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 71 Definisi 3.1 Kurva sensitivitas dari penduga 𝑇𝑛 , didefinisikan untuk 𝑛 = 2,3, …, pada sampel 𝑥1 , … , 𝑥𝑛−1 adalah 𝑆𝐶(𝑥; 𝑥1 , … , 𝑥𝑛−1 , 𝑇𝑛 ) = 𝑛{𝑇𝑛 (𝑥1 , … , 𝑥𝑛−1 , 𝑥) − 𝑇𝑛−1 (𝑥1 , … , 𝑥𝑛−1 )}. Kurva sensitivitas dianggap sebagai fungsi dari penambahan pengamatan 𝑥, tetapi bergantung pada sampel dan bentuk dari penduga. Notasi untuk kurva sensitivitas adalah 𝑆𝐶(𝑥). Contoh 3.1 Diberikan pengamatan sampel 𝑥1 , … , 𝑥𝑛−1. Pengamatan sampel dengan penambahan 𝑥, yaitu 𝑥1 , … , 𝑥𝑛−1 , 𝑥. Tentukanlah kurva sensitivitas dari penduga rata-rata sampel. Solusi: Penduga 𝑇𝑛 = 𝑥̅ = ∑𝑛 𝑖=1 𝑥𝑖 𝑛 𝒊 𝒙𝒊 1 𝑥1 2 𝑥2 ⋮ ⋮ 𝑛−1 𝑥𝑛−1 𝑛 𝑥𝑛 . 𝑆𝐶(𝑥) = 𝑛{𝑇𝑛 (𝑥1 , … , 𝑥𝑛−1 , 𝑥) − 𝑇𝑛−1 (𝑥1 , … , 𝑥𝑛−1 )} ∑𝑛𝑖=1 𝑥𝑖 ∑𝑛−1 𝑖=1 𝑥𝑖 = 𝑛( − ) 𝑛 𝑛−1 𝑛 𝑛−1 𝑖=1 𝑖=1 𝑛 = (∑ 𝑥𝑖 − ∑ 𝑥𝑖 ) 𝑛−1 Nilai tambahan Contoh 3.2 Diberikan data pengamatan sampel berukuran 𝑛 − 1 sebagai berikut. 𝒊 1 2 3 4 5 6 7 8 9 𝒙𝒊 5 6 7 8 9 10 11 12 13 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 72 Tentukanlah kurva sensitivitas dari penduga rata-rata sampel tersebut dengan nilai tambahan yang berbeda-beda, yaitu 90, 150, 225, 450. Solusi: Dengan menggunakan rumus yang telah diperoleh pada Contoh 3.1, untuk 𝑥𝑛 = 90 * untuk 𝑥𝑛 = 150 𝑛 𝑛−1 𝑖=1 𝑖=1 𝑛 𝑆𝐶(𝑥) = ∑ 𝑥𝑖 − ∑ 𝑥𝑖 𝑛−1 𝑛−1 𝑖=1 𝑖=1 𝑛 𝑆𝐶(𝑥) = ∑ 𝑥𝑖 − ∑ 𝑥𝑖 𝑛−1 = 171 − 90 = 81 𝑛 = 231 − 90 = 141 untuk 𝑥𝑛 = 225 * untuk 𝑥𝑛 = 450 𝑛 𝑛−1 𝑖=1 𝑖=1 𝑛 𝑆𝐶(𝑥) = ∑ 𝑥𝑖 − ∑ 𝑥𝑖 𝑛−1 𝑛 𝑛−1 𝑖=1 𝑖=1 𝑛 𝑆𝐶(𝑥) = ∑ 𝑥𝑖 − ∑ 𝑥𝑖 𝑛−1 = 306 − 90 = 531 − 90 = 216 = 441 450 SC (x) 350 250 150 50 0 100 200 300 400 Xn Gambar 3.1. Kurva Sensitivitas untuk Rata-rata Dari Gambar 3.1 terlihat bahwa semakin besar nilai tambahan pada data pengamatan, semakin besar pula nilai dari sensitivitas kurva untuk rata-rata. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 73 Contoh 3.3 Misalkan 𝑛 = 2𝑚 + 1 adalah bilangan ganjil dan penduganya adalah median. Misalkan 𝑥(1) < ⋯ < 𝑥(𝑛−1) adalah statistik terurut bagi sampel 𝑥1 , … , 𝑥𝑛−1. Kemudian 𝑇𝑛−1 (𝑥1 , … , 𝑥𝑛−1 ) = 1 [𝑥 + 𝑥(𝑚+1) ], 2 (𝑚) dan 1 𝑛 𝑛 {𝑥(𝑚) − [𝑥(𝑚) + 𝑥(𝑚+1) ]} = [𝑥(𝑚) − 𝑥(𝑚+1) ] jika 𝑥 < 𝑥(𝑚) , 2 2 1 𝑆𝐶(𝑥) = 𝑛 {𝑥 − [𝑥(𝑚) + 𝑥(𝑚+1) ]} jika 𝑥(𝑚) ≤ 𝑥 ≤ 𝑥(𝑚+1) , 2 1 𝑛 𝑛 − + 𝑥(𝑚+1) ]} = [𝑥(𝑚+1) − 𝑥(𝑚) ] jika 𝑥 > 𝑥(𝑚+1) . { {𝑥(𝑚+1) 2 [𝑥(𝑚) 2 SC (x) Xn Gambar 3.2. Kurva Sensitivitas untuk Median Contoh 3.3 Contoh 3.4 Diberikan data pengamatan statistik terurut pada sampel berukuran 𝑛 − 1 sebagai berikut. 𝒊 1 2 3 4 5 6 7 8 𝒙𝒊 5 6 7 8 9 10 11 12 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 74 Tentukanlah kurva sensitivitas dari penduga median sampel tersebut dengan nilai tambahan yang sama seperti nilai tambahan pada Contoh 3.2, yaitu 90, 150, 225, 450. Solusi: Karena 𝑛 = 9 adalah bilangan ganjil, maka 𝑚 = 4. Dengan menggunakan rumus pada Contoh 3.3, untuk 𝑥 = 90 * untuk 𝑥 = 150 𝑛 𝑆𝐶(𝑥) = [𝑥(𝑚+1) − 𝑥(𝑚) ] 2 𝑆𝐶(𝑥) 2 = 4.5(9 − 8) = 4.5(9 − 8) = 4.5 = 4.5 untuk 𝑥 = 225 * untuk 𝑥 = 450 𝑛 𝑆𝐶(𝑥) = [𝑥(𝑚+1) − 𝑥(𝑚) ] 𝑆𝐶(𝑥) 𝑛 = [𝑥(𝑚+1) − 𝑥(𝑚) ] 2 𝑛 = [𝑥(𝑚+1) − 𝑥(𝑚) ] 2 = 4.5(9 − 8) = 4.5(9 − 8) = 4.5 = 4.5 5 SC (x) 4 3 2 1 0 0 100 200 300 400 Xn Gambar 3.3. Kurva Sensitivitas untuk Median Contoh 3.4 Dari gambar 3.3 terlihat bahwa semakin besar nilai tambahan pada data pengamatan, maka nilai dari kurva sensitivitas untuk median adalah suatu nilai yang konstan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 75 C. Penduga 𝑴 (Penduga Huber) Salah satu teori untuk mempelajari sifat 𝑟𝑜𝑏𝑢𝑠𝑡 dari penduga lokasi yang sangat sederhana adalah dengan menerapkan penduga 𝑀. Penduga 𝑀 diperkenalkan oleh Huber (1964, 1967), yang meminimalkan fungsi deviasi pengamatan dari nilai dugaan. Dengan cara ini, penduga 𝑀 meliputi rata-rata dan median sebagai kasus khusus. Di samping itu, secara umum penduga 𝑀 merupakan penduga kemungkinan maksimum (maximum-likelihood) dari parameter lokasi di dalam distribusi tertentu. Dengan demikian, pemilihan penduga 𝑀 yang sesuai akan memiliki efisiensi robust yang baik di dalam sampel berukuran besar. Penduga 𝑀 meminimalkan fungsi tujuan yang bersifat lebih umum daripada yang sudah dikenal, yaitu jumlah kuadrat residual terkait dengan ratarata sampel. Penduga 𝑀 menerapkan fungsi 𝜌(𝑥; 𝑡) dan membentuk fungsi tujuan dengan menjumlahkan untuk seluruh sampel: ∑𝑛𝑖=1 𝜌(𝑥𝑖 ; 𝑡). Seringkali 𝜌(𝑥; 𝑡) hanya tergantung pada 𝑥 dan 𝑡 melalui 𝑥 − 𝑡, sehingga dapat ditulis 𝜌(𝑥 − 𝑡). Sifat 𝜌 menentukan sifat-sifat penduga 𝑀. Definisi 3.2 Penduga 𝑀, 𝑇𝑛 (𝑥1 , … , 𝑥𝑛 ) sebagai fungsi 𝜌 dan sampel 𝑥1 , … , 𝑥𝑛 adalah nilai 𝑡 yang meminimalkan fungsi tujuan ∑𝑛𝑖=1 𝜌(𝑥𝑖 ; 𝑡). Jika diketahui turunan dari 𝜌 terhadap 𝑡, maka sebuah fungsi yang dilambangkan dengan 𝜓 dapat digunakan untuk menentukan 𝑇𝑛 dengan mencari nilai 𝑡 yang memenuhi: ∑𝑛𝑖=1 𝜓(𝑥𝑖 ; 𝑡) = 0. (Hoaglin, et al: 341) Contoh 3.5. Rata-rata Sampel Misalkan 𝑇𝑛 = 𝑥̅ dari sampel acak 𝑥1 , … , 𝑥𝑛 sebagai fungsi 𝜌, yaitu kuadrat residual yang diberikan dengan: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 76 𝜌(𝑥; 𝑡) = (𝑥 − 𝑡)2 . Carilah nilai 𝑡. Solusi: Akan dicari terlebih dahulu turunan dari 𝜌(𝑥; 𝑡) terhadap 𝑡, yaitu: 𝜌′ (𝑥; 𝑡) = 𝑑𝜌(𝑥; 𝑡) = −2(𝑥 − 𝑡) 𝑑𝑡 Selanjutnya mencari nilai 𝑡 yang memenuhi: 𝑛 ∑ 𝜓(𝑥𝑖 ; 𝑡) = 0 𝑖=1 𝑛 ∑(𝑥𝑖 − 𝑡) = 0 𝑖=1 𝑛 ∑ 𝑥𝑖 − 𝑛𝑡 = 0 𝑖=1 ∑𝑛𝑖=1 𝑥𝑖 𝑡= = 𝑥̅ . 𝑛 Karena 𝑡 = ∑𝑛𝑖=1 𝑥𝑖 ⁄𝑛 menyelesaikan persamaan tersebut, maka 𝑇𝑛 benar sebagai penduga rata-rata sampel. Gambar 3.4 menunjukkan fungsi 𝜌 dan 𝜓 untuk ratarata sampel. (a) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 77 (b) Gambar 3.4. Penduga dengan fungsi tujuan kuadrat residual. (a) Fungsi Tujuan, 𝜌(𝑥; 𝑡) = (𝑥 − 𝑡)2 ; (b) Fungsi 𝜓, 𝜓(𝑥; 𝑡) = 𝑥 − 𝑡. Rata-rata memiliki 𝜓(𝑥𝑖 ; 𝑇𝑛 ) = 𝑥𝑖 − 𝑇𝑛 yang sensitif terhadap semua pengamatan dan secara khusus saat dipengaruhi oleh adanya pencilan. Fungsi 𝜓 tak terbatas di kedua arah seperti yang digambarkan pada Gambar 3.4 (b). Dari grafik tersebut dapat dibaca bahwa adanya pencilan yang sangat kecil atau sangat besar akan berpengaruh terhadap rata-rata (sensitif). Contoh 3.6. Median Sampel Misalkan 𝑇𝑛 sebagai penduga median dari sampel acak 𝑥1 , … , 𝑥𝑛 . Fungsi 𝜌 adalah nilai mutlak residual yang diberikan dengan: 𝜌(𝑥; 𝑡) = |𝑥 − 𝑡|. Akan ditunjukkan bahwa penyelesaian dari ∑𝑛𝑖=1 𝜓(𝑥𝑖 ; 𝑡) = 0 adalah median. Sebelum menyelesaikan persamaan tersebut, terlebih dahulu akan didefinisikan fungsi signum. Definisi 3.3 Misalkan diberikan nilai mutlak 𝑥 yang dinotasikan dengan |𝑥|. Turunan dari nilai mutlak 𝑥 adalah sebuah fungsi signum yang didefinisikan dengan: +1 sgn(𝑥) = { 0 −1 ,𝑥 > 0 ,𝑥 = 0 , 𝑥 < 0. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 78 Contoh 3.7 Temukan turunan 𝑓′(𝑥) dari 𝑓(𝑥) = |𝑥 − 1|. Solusi: Misalkan 𝑢 = 𝑥 − 1, diperoleh turunan dari 𝑓(𝑥) adalah sebagai berikut: +1 sgn(𝑢) = { 0 −1 ,𝑥 > 1 ,𝑥 = 1 , 𝑥 < 1. Selanjutnya akan dicari solusi untuk Contoh 3.6. Turunan dari 𝜌(𝑥; 𝑡) = |𝑥 − 𝑡| adalah sebagai berikut: 𝜓(𝑥; 𝑡) = sgn(𝑥 − 𝑡), dengan 𝑢 = 𝑥 − 𝑡, +1 sgn(𝑢) = { 0 −1 ,𝑥 > 𝑡 ,𝑥 = 𝑡 , 𝑥 < 𝑡. Rumus 𝑛 ∑ 𝑖=1 𝑛 𝜓(𝑥𝑖 ; 𝑡) = ∑ sgn(𝑥𝑖 − 𝑡) 𝑖=1 menghitung setiap pengamatan yang lebih dari 𝑡 akan bernilai +1 dan setiap pengamatan yang kurang dari 𝑡 akan bernilai −1, sehingga 𝑡 = median yang menghasilkan jumlahan nol. Gambar 3.5 menunjukan 𝜌 dan 𝜓 sebagai fungsi tujuan mutlak residual. (a) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 79 (b) Gambar 3.5. Pendugaan dengan fungsi tujuan mutlak residual. (a) Fungsi Tujuan, 𝜌(𝑥; 𝑡) = |𝑥 − 𝑡|; (b) Fungsi 𝜓, 𝜓(𝑥; 𝑡) = sgn(𝑥 − 𝑡). Pemilihan fungsi tujuan untuk pendugaan 𝑀 menggeneralisasikan pendugaan kuadrat terkecil. Namun demikian, fungsi 𝜓 bekerja lebih baik daripada fungsi 𝜌. Median adalah solusi dari ∑𝑛𝑖=1 sgn(𝑥𝑖 − 𝑇𝑛 ) = 0. Median insensitif terhadap pencilan tetapi sensitif terhadap nilai dari satu atau dua pengamatan yang berada di tengah. Fungsi 𝜓 terbatas tetapi memiliki sebuah loncatan pada 0 seperti yang digambarkan pada Gambar 3.5 (b). Dari grafik tersebut dapat dibaca bahwa adanya pencilan yang sangat kecil atau sangat besar tidak berpengaruh terhadap median (insensitif). D. MAD (Median Absolute Deviation) MAD ditemukan dan dipopulerkan oleh Hampel (1974) sebagai salah satu penduga skala yang robust, yaitu menduga standar deviasi dari sampel. Dapat dikatakan bahwa MAD sebagai penduga skala yang insensitif terhadap adanya pencilan. Huber (1981) mendeskripsikan MAD sebagai "penduga skala tunggal yang paling berguna". PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 80 Contoh 3.8 Diketahui data sebagai berikut: 4.5 4.9 5.6 4.2 6.2 5.2 9.9 Temukanlah nilai MAD dari data tersebut. Solusi: Langkah awal adalah melakukan pendeteksian pencilan pada data. Dengan menggunakan pendeteksian uji MAD melalui program R (lampiran 2), diperoleh: Gambar 3.6. Hasil Pendeteksian Uji MAD Melalui Gambar 3.6 dapat terlihat bahwa data memuat pencilan pada 𝑥 = 9.9. Langkah selanjutnya adalah menghitung nilai MAD yang memerlukan tahaptahap sebagai berikut. (a) Urutkan setiap pengamatan dalam data dari yang terkecil sampai yang terbesar, sehingga diperoleh 4.2 4.5 (b) 4.9 5.2 5.6 6.2 9.9 Carilah median dari data pengamatan terurut tersebut. Karena 𝑛 = 7 (ganjil), maka diperoleh 𝑥̃ = 𝑥(𝑛+1)/2 = 𝑥4 = 5.2. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 81 (c) Setiap pengamatan terurut dikurangi dengan median yang menghasilkan nilai-nilai mutlak, yaitu 1.0 (d) 0.7 0.0 0.4 1.0 4.7 Urutkan hasil yang diperoleh pada (c), sehingga diperoleh 0.0 (e) 0.3 0.3 0.4 0.7 1.0 1.0 4.7 Temukan median dari data terurut pada (d). Karena 𝑛 = 7 (ganjil), maka diperoleh 𝑥̃ = 𝑥(𝑛+1)/2 = 𝑥4 = 0.7. (f) Temukan MAD dengan cara mengalikan median pada (e) dengan 𝑏 = 1.4826, sehingga diperoleh: MAD = 1.4826 × 0.7 = 1.03782. ∎ Untuk menguji kerobustan dari penduga MAD akan ditunjukkan dengan kurva sensitivitas yang akan dibandingkan dengan standar deviasi (𝑠). Melalui data pada Contoh 3.8 dan dengan diberikan penambahan nilai ekstrim yang berbeda-beda, yaitu 9.9, 50, 75, 105 akan diperoleh kurva sensitivitas sebagai berikut: (a) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 82 (b) Gambar 3.7. (a) Kurva Sensitivitas untuk MAD; (b) Kurva Sensitivitas untuk Standar Deviasi. Dari grafik tersebut dapat dibaca bahwa adanya pencilan yang sangat kecil atau sangat besar tidak berpengaruh terhadap MAD (insensitif), tetapi berpengaruh pada standar deviasi (sensitif). E. Selang Kepercayaan Robust bagi Parameter Lokasi Selang kepercayaan robust berdasarkan penduga yang robust dapat terbentuk ketika distribusi yang mendasari bukan dari distribusi simetris. Kepercayaan robust diperkenalkan oleh Huber (1968). Fraiman, et al (2001) mengkonstruksikan selang kepercayaan robust berdasarkan optimal robust pada penduga 𝑀 bagi parameter lokasi. Selang kepercayaan robust bagi parameter lokasi dengan penduga median diperkenalkan oleh Staudte dan Sheater (1990). Seperti yang telah dibahas pada Bab II subbab 2.2 tentang penduga selang kepercayaan, maka cara paling umum untuk menemukan selang kepercayaan 100 (1 − 𝛼)% bagi pusat distribusi simetris adalah 𝑥̅ ± 𝑡1−𝛼⁄2;𝑛−1 (𝑠/√𝑛), PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 83 dengan 𝑡 adalah titik 100 (1 − 𝛼/2)% dari distribusi 𝑡 pada derajat bebas 𝑛 − 1. Selang tersebut adalah selang kepercayaan bagi penduga lokasi dan skala yang lebih efisien untuk distribusi Normal. Apa yang terjadi jika data tidak berdistribusi Normal, tetapi dari distribusi yang miring? Karena kedua 𝑥̅ dan 𝑠 mempunyai efisiensi yang rendah, maka kemungkinan selang akan bervariasi dari sampel yang satu dengan yang lainnya. Nilai dari rata-rata dan variansi sampel mungkin cukup besar dan cenderung memberikan selang yang relatif lebar. Oleh karena itu, digunakan cara alternatif untuk menemukan selang kepercayaan yang 𝑟𝑜𝑏𝑢𝑠𝑡. Berikut diperkenalkan dua selang kepercayaan robust bagi parameter lokasi, yaitu selang kepercayaan robust dengan penduga median dan penduga Huber. Definisi 3.4 Selang kepercayaan robust bagi parameter lokasi dengan penduga median diberikan dengan 𝑥̃ ± 𝑡1−𝛼⁄2;𝑛−1 𝑆𝐸(𝑥̃), dengan 𝑥̃ adalah median sampel dan 𝑆𝐸(𝑥̃) adalah galat standar bagi median. Galat standar bagi median yang diberikan oleh Fraiman et al (2001) adalah sebagai berikut: 𝑆𝐸(𝑥̃) = 𝑠∗ √𝑛 , dengan 𝑠 ∗ = (𝑥𝑎 − 𝑥𝑏 )⁄3.4641. Nilai 𝑎 dan 𝑏 dapat diperoleh dengan: 𝑛 𝑎=2+ √3𝑛 2 𝑛 dan 𝑏 = 2 − √3𝑛 . 2 Galat standar bagi median yang diberikan oleh Kendall dan Stuart (2001) adalah sebagai berikut: 𝜋 𝑠 𝑆𝐸(𝑥̃) = √ × 𝑆𝐸(𝑥̅ ) = 1.2533 × , 2 √𝑛 dengan 𝑆𝐸(𝑥̅ ) adalah galat standar bagi rata-rata dan 𝑠 adalah standar deviasi sampel. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 84 Definisi 3.5 Selang kepercayaan robust berdasarkan penduga Huber diberikan dengan 𝐻𝑢𝑏𝑒𝑟 ± 𝑡1−𝛼⁄2;𝑛−1 (𝑠𝐻𝑢𝑏𝑒𝑟 ), dengan Huber adalah penduga 𝑀 bagi lokasi dan 𝑠𝐻𝑢𝑏𝑒𝑟 adalah galat standar bagi penduga Huber yang diberikan dengan 𝑠𝐻𝑢𝑏𝑒𝑟 = 𝑀𝐴𝐷(𝑥) 1.486 (Cetin, Meral., Aktas, Serpil., 2008: 254) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB IV SELANG KEPERCAYAAN ROBUST DENGAN SIMULASI DATA ACAK Kinerja selang kepercayaan yang robust dari parameter lokasi diilustrasikan dengan menggunakan pengkodean program R. Empat jenis selang kepercayaan yang akan disimulasikan adalah selang kepercayaan bagi parameter lokasi dengan penduga titik berupa rata-rata sampel, median dengan galat standar dari Fraiman, et al (2001), median dengan galat standar dari Kendall dan Stuart (2001), dan Huber (pendugaan 𝑀). Selang kepercayaan menggunakan tingkat kepercayaan sebesar 95% untuk setiap penduga. Sampel acak dihasilkan dari distribusi Normal, Cauchy, dan Chi-Square untuk ukuran sampel 𝑛 = 10, 50, 100, dan 500, sebagaimana diketahui bahwa distribusi Cauchy dan Chi-Square adalah dua contoh distribusi yang miring ke kanan (tidak simetris). Untuk melihat pengaruh pencilan pada suatu penduga dan juga pada selang kepercayaan, digunakan simulasi data yang diimplementasikan memuat nilai tambahan sebagai pencilan. Pencilan ini digunakan untuk ukuran sampel yang sama. Hasil simulasi data acak yang diperoleh dengan menggunakan program R dilampirkan pada lampiran 5 sampai dengan lampiran 7. List code pemrograman yang terlampir hanya data dari distribusi Normal berukuran 𝑛 = 10 (lampiran 3) dan yang lainnya diperoleh secara analog. Diberikan pula plot yang menggambarkan setiap nilai tambahan yang diberikan terhadap galat standar dari masing-masing penduga. Batas bawah dan batas atas selang kepercayaan ditunjukkan pada Tabel 4.1 sampai Tabel 4.12 (lampiran 5 sampai dengan lampiran 7) berkenaan dengan ukuran sampel dan pencilan. Gambar 4.1 sampai Gambar 4.12 (lampiran 5 sampai dengan lampiran 7) menunjukkan galat standar dari masingmasing penduga lokasi terhadap setiap nilai tambahan yang diberikan. Berdasarkan hasil pembangkitan data dengan simulasi pada Tabel 4.1 sampai dengan Tabel 4.12 (lampiran 5 sampai dengan lampiran 7) dapat dihasilkan beberapa temuan berikut: 85 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 86 Distribusi 𝑛 Tabel 4.13. Hasil Simulasi Data Acak Metode Temuan 10 50 100 Semakin besar nilai pencilan, semakin 1 selang kepercayaan (selang bersifat sensitif terhadap pencilan) 10 Galat 50 kepercayaan tidak mengalami perubah2 100 dan lebar selang an meskipun nilai pencilan semakin hadap pencilan) 10 50 standar besar (selang bersifat insensitif ter- 500 Lampiran Semakin besar nilai pencilan, semakin 3 selang kepercayaan (selang bersifat sensitif terhadap pencilan) 10 Galat 50 kepercayaan tidak mengalami perubah4 standar dan lebar selang an meskipun nilai pencilan semakin besar (selang bersifat insensitif ter- 500 hadap pencilan) 10 Semakin besar nilai pencilan, semakin 50 100 1 besar galat standar dan semakin lebar selang kepercayaan (selang bersifat 500 sensitif terhadap pencilan) 10 Galat 50 kepercayaan tidak mengalami perubah- 100 Lampiran 2 standar dan lebar selang an meskipun nilai pencilan semakin besar (selang bersifat insensitif ter- 500 5 besar galat standar dan semakin lebar 500 100 Cauchy besar galat standar dan semakin lebar 500 100 Normal Ket hadap pencilan) 6 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 87 Distribusi 𝑛 Metode 10 50 100 Cauchy Semakin besar nilai pencilan, semakin 3 besar galat standar dan semakin lebar selang kepercayaan (selang bersifat sensitif terhadap pencilan) 10 Galat 50 kepercayaan tidak mengalami perubah- Lampiran 4 100 dan lebar selang an meskipun nilai pencilan semakin Semakin besar nilai pencilan, semakin 1 besar galat standar dan semakin lebar selang kepercayaan (selang bersifat 500 sensitif terhadap pencilan) 10 Galat 50 kepercayaan tidak mengalami perubah- 100 2 dan lebar selang an meskipun nilai pencilan semakin hadap pencilan) 10 100 standar besar (selang bersifat insensitif ter- 500 50 Lampiran Semakin besar nilai pencilan, semakin 3 besar galat standar dan semakin lebar selang kepercayaan (selang bersifat 500 sensitif terhadap pencilan) 10 Galat 50 kepercayaan tidak mengalami perubah- 100 500 6 hadap pencilan) 10 50 standar besar (selang bersifat insensitif ter- 500 Square Ket 500 100 Chi- Temuan 4 standar dan lebar selang an meskipun nilai pencilan semakin besar (selang bersifat insensitif terhadap pencilan) 7 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 88 Keterangan: Metode selang kepercayaan (SK) yang digunakan, yaitu 1. SK dengan penduga µ menurut Definisi 2.33 2. SK robust dengan penduga median (Fraiman, et al) menurut Definisi 3.4 3. SK robust dengan penduga median (Kendall dan Stuart) menurut Definisi 3.4 4. SK robust dengan penduga Huber menurut Definisi 3.5 Dari temuan yang diperoleh pada Tabel 4.13 di atas dapat disimpulkan bahwa statistik untuk setiap ukuran sampel rata-rata dan median (Kendall dan Stuart, 2001) sangat sensitif terhadap kehadiran pencilan, yang ditunjukkan dengan semakin besarnya galat standar dan semakin lebarnya selang kepercayaan. Sebaliknya, hal ini tidak terjadi pada penduga robust median (Fraiman, et al) dan penduga Huber. Kedua penduga menghasilkan galat standar dan lebar selang kepercayaan yang tetap, meskipun nilai pencilan semakin besar (penduga tidak sensitif terhadap pencilan). Penduga robust median (Fraiman, et al) adalah penduga robust yang lebih baik dari penduga Huber, karena memiliki galat standar yang lebih kecil dan lebar selang kepercayaan yang relatif lebih sempit. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI BAB V KESIMPULAN DAN SARAN A. Kesimpulan Hasil simulasi data acak dari distribusi Normal, Cauchy, dan Chi-Square dengan ukuran sampel 𝑛 = 10, 50, 100, 500 untuk setiap distribusi, menemukan bahwa selang kepercayaan bagi parameter lokasi dengan penduga rata-rata dan median yang menggunakan galat standar dari Kendall dan Stuart (2001) sangat sensitif terhadap pencilan. Hal ini terlihat dari semakin besar nilai pencilan, semakin besar galat standar dan semakin lebar selang kepercayaan untuk setiap ukuran sampel. Sebaliknya hal ini tidak terjadi pada selang kepercayaan robust bagi parameter lokasi dengan penduga median yang menggunakan galat standar dari Fraiman, et al (2001) dan penduga Huber. Kedua penduga menghasilkan galat standar dan lebar selang kepercayaan yang tetap, meskipun nilai pencilan semakin besar (penduga tidak sensitif terhadap pencilan). Akan tetapi dari antara penduga median dengan menggunakan galat standar dari Fraiman, et al (2001) dan penduga Huber, penduga robust yang paling baik adalah penduga median dengan menggunakan galat standar dari Fraiman, et al. Hal ini dikarenakan penduga median tersebut menghasilkan galat standar yang kecil dan membentuk selang kepercayaan yang relatif lebih sempit. B. Saran Penulis sadar bahwa dalam penulisan skripsi ini masih banyak kekurangan. Oleh sebab itu, penulis mengharapkan kelak ada yang melanjutkan penelitian ini. Tulisan ini hanya membahas penyelesaian selang kepercayaan robust bagi parameter lokasi dengan penduga median yang menggunakan galat standar dari Fraiman, et al (2001), penduga median yang menggunakan galat standar dari Kendall dan Stuart (2001), dan penduga Huber. Penulis berharap di waktu yang akan datang, ada yang melanjutkan penulisan ini dengan metode yang lain dan lebih baik. Misalnya, selang kepercayaan robust bagi parameter skala dengan suatu penduga yang robust. 89 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI DAFTAR PUSTAKA Acuna, Edgar., and Rodriguez, Caroline. On Detection of Outliers and Their Effect in Supervised Classification. Mayaguez: Department of Mathematics. (https://www.researchgate.net/publication/228965221_On_Detection_Of_Out liers_And_Their_Effect_In_Supervised_Classification) Analytical Methods Commitee. (2001). Robust Statistics: A Method of Coping with Outliers. AMC Technical Brief, 6. Barnett, Vic., and Lewis, T. (1978). Outliers In Statistical Data. First Edition. Chichester: John Wiley dan Sons. Ben-Gal, Irad. (2005). Outlier Detection. Israel: Kluwer Academic Publisher. Cetin, Meral., and Aktas, Serpil. (2008). Confidence Interval Based on Robust Estimators. Digital Commons, 7 (1): 253-258. Dan, E. D., and Ijeoma, O. A. (2013). Statistical Analysis/Methods of Detecting Outliers in A Univariate Data in A Regression Analysis Model. International Journal of Education and Research, 1 (5): 1-24. Dawson, Robert. (2011). How Significant Is A Boxplot Outlier?. Journal of Statistics Education, 19 (2): 1-13. Fraiman, R., et al. (2001). Optimal Robust M-estimates of Location. Annals of Statistics, 29 (1): 194-223. Harding, Bradley., et al. Standard Errors: A Review and Evaluation of Standard Error Estimators Using Monte Carlo Simulations. The Quantitative Methods for Psychology, 10 (2): 107-123. 90 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 91 Hoaglin, D. C., et al. (1983). Understanding Robust and Exploratory Data Analysis. New York: John Wiley dan Sons. Location & Scale Parameter.ppt (https://www.google.co.id/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2& cad=rja&uact=8&ved=0ahUKEwiQoOug95rVAhWCEbwKHZHzAEcQFggr MAE&url=http%3A%2F%2Fusers.metu.edu.tr%2Foilk%2F6.LOCATION% 2520%26%2520SCALE%2520PARAMETERS%2520%2520552.ppt&usg=AFQjCNGEkRudSE8PgQvBOeLpbcXKCl62Qw) Leys, C., et al. (2013). Detecting Outliers: Do Not Use Standard Deviation Around The Mean, Use Absolute Deviation Around The Median. Journal of Experimental Social Psychology, 3. Navidi, William. (2011). Statistics for Engineers and Scientists. Third Edition. New York: The McGraw-Hill Companies. Paludi, Salman. (2009). Identifikasi dan Pengaruh Keberadaan Data Pencilan (Outlier). Majalah Ilmiah Panorama Nusantara, VI: 56-62. Rousseeuw, P. J., and Croux, Christophe. (1993). Alternatives to the Median Absolute Deviation. Journal of the American Statistical Association, 88 (424): 1273-1283. Staudte, R. G., and Sheater, S. J. (1990). Robust Estimation and Testing. New York: John Wiley dan Sons. Wackerly, D. D., et al. (2008). Mathematical Statistics With Applications. Seventh Edition. Duxubury: Thompson Brooks/Cole. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 92 Walpole , R. E., et al. (2012). Probability dan Statistics for Engineers dan Scientists. Ninth Edition. New York: Prentice Hall. William, David. (1991). Probability with Martingales. New York: Cambridge University Press. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 93 LAMPIRAN PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Berikut ini merupakan list code pada program statistika R versi 3.3.3. Lampiran 1 Contoh 2.31. Uji Grubbs > x=scan(file.choose(),skip=0) Read 36 items >x [1] 1200 2566 3120 3728 4206 6500 1206 2635 3137 3748 4268 6565 [13] 1515 2680 3163 3775 4526 6928 1965 2735 3211 4006 5651 7606 [25] 2048 2974 3698 4065 6454 14791 2000 2972 3590 4023 6387 10825 #Uji Normalitas Data > shapiro.test(x) Shapiro-Wilk normality test data: x W = 0.80159, p-value = 1.752e-05 #Pengujian dengan 𝜶 = 𝟎. 𝟎𝟓 > library(outliers) > library(ggplot2) > grubbs.flag=function(x) { + outliers=NULL + test=x 94 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 95 + grubbs.result <- grubbs.test(test) + pv <- grubbs.result$p.value + while(pv < 0.05) { + outliers <- c(outliers,as.numeric(strsplit(grubbs.result$alternative," ")[[1]][3])) + test <- x[!x %in% outliers] + grubbs.result <- grubbs.test(test) + pv <- grubbs.result$p.value +} + return(data.frame(X=x,Outlier=(x %in% outliers))) +} > grubbs.flag(x) X Outlier 1 1200 FALSE 2 2566 FALSE 3 3120 FALSE 4 3728 FALSE 5 4206 FALSE 6 6500 FALSE 7 1206 FALSE 8 2635 FALSE 9 3137 FALSE PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 96 10 3748 FALSE 11 4268 FALSE 12 6565 FALSE 13 1515 FALSE 14 2680 FALSE 15 3163 FALSE 16 3775 FALSE 17 4526 FALSE 18 6928 FALSE 19 1965 FALSE 20 2735 FALSE 21 3211 FALSE 22 4006 FALSE 23 5651 FALSE 24 7606 FALSE 25 2048 FALSE 26 2974 FALSE 27 3698 FALSE 28 4065 FALSE 29 6454 FALSE 30 14791 TRUE PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 97 31 2000 FALSE 32 2972 FALSE 33 3590 FALSE 34 4023 FALSE 35 6387 FALSE 36 10825 TRUE #Plot Pencilan > ggplot(grubbs.flag(x),aes(x=X,color=Outlier,fill=Outlier))+ + geom_histogram(binwidth=diff(range(x))/30)+ + theme_bw() Lampiran 2 Contoh 3.8. Uji MAD > x=c(4.5,4.9,5.6,4.2,6.2,5.2,9.9) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 98 > center=median(x, na.rm = F) > center [1] 5.2 > MAD=mad(x, center, constant = 1.4826, na.rm = FALSE) > MAD [1] 1.03782 > require(BHH2) > dotchart(x) > mean.x=mean(x) > sd.x=sd(x) > lines(rep(mean.x,2),c(0.2, 0.25)) #Vertical line at mean > lines(rep(mean.x + 2*sd.x, 2), c(0.2, 0.25)) #Vertical line at mean + 2 SD > text(mean.x , 0.3, expression(bar(x))) > text(mean.x + 2*sd.x, 0.3, expression(paste(bar(x), " + 2s"))) Lampiran 3 Simulasi BAB IV #Membangkitkan Data dari distribusi Normal Berukuran n-1=9 > a=rnorm(9,10,2) >a [1] 8.750761 11.132768 10.929959 13.235969 6.478947 7.073720 8.932900 [8] 10.150914 8.525724 #Cari Nilai Maksimum Untuk Menentukan Penambahan Nilai Ekstrim > max(a) [1] 13.23597 #Nilai tambahan informasi > x=c(20,30,50,90,100) #Mencari Nilai t > n=10 > alpha=0.1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 99 > t=qt(1-(alpha/2),df=n-1) >t [1] 1.833113 #Pembentukan Data Setelah Diberi Nilai Tambahan > ax1=c(a,x[1]) > ax2=c(a,x[2]) > ax3=c(a,x[3]) > ax4=c(a,x[4]) > ax5=c(a,x[5]) #Cek Pencilan dengan Metode Boxplot > par(mfrow=c(2,3)) > boxplot(ax1) > boxplot(ax2) > boxplot(ax3) > boxplot(ax4) > boxplot(ax5) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 100 #Mencari Galat standar #Galat standar bagi 𝝁 > SExbar.ax1=sd(ax1)/sqrt(n) > SExbar.ax1 [1] 1.228187 > SExbar.ax2=sd(ax2)/sqrt(n) > SExbar.ax2 [1] 2.14822 > SExbar.ax3=sd(ax3)/sqrt(n) > SExbar.ax3 [1] 4.102154 > SExbar.ax4=sd(ax4)/sqrt(n) > SExbar.ax4 [1] 8.077951 > SExbar.ax5=sd(ax5)/sqrt(n) > SExbar.ax5 [1] 9.075225 #Galat standar bagi Median menurut Fraiman et al > o=(n/2)+(sqrt(3*n)/2) > p=(n/2)-(sqrt(3*n)/2) > SEmedian.Fraiman.ax1=abs((ax1[o]-ax1[p])/(3.4641*sqrt(n))) > SEmedian.Fraiman.ax1 [1] 0.2008196 > SEmedian.Fraiman.ax2=abs((ax2[o]-ax2[p])/(3.4641*sqrt(n))) > SEmedian.Fraiman.ax2 [1] 0.2008196 > SEmedian.Fraiman.ax3=abs((ax3[o]-ax3[p])/(3.4641*sqrt(n))) > SEmedian.Fraiman.ax3 [1] 0.2008196 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 101 > SEmedian.Fraiman.ax4=abs((ax4[o]-ax4[p])/(3.4641*sqrt(n))) > SEmedian.Fraiman.ax4 [1] 0.2008196 > SEmedian.Fraiman.ax5=abs((ax5[o]-ax5[p])/(3.4641*sqrt(n))) > SEmedian.Fraiman.ax5 [1] 0.2008196 #Galat standar bagi Median menurut Kendall and Stuart > SEmedian.Kendall.ax1=sqrt(pi/2)*SExbar.ax1 > SEmedian.Kendall.ax1 [1] 1.539304 > SEmedian.Kendall.ax2=sqrt(pi/2)*SExbar.ax2 > SEmedian.Kendall.ax2 [1] 2.692395 > SEmedian.Kendall.ax3=sqrt(pi/2)*SExbar.ax3 > SEmedian.Kendall.ax3 [1] 5.141287 > SEmedian.Kendall.ax4=sqrt(pi/2)*SExbar.ax4 > SEmedian.Kendall.ax4 [1] 10.12421 > SEmedian.Kendall.ax5=sqrt(pi/2)*SExbar.ax5 > SEmedian.Kendall.ax5 [1] 11.37411 #Galat standar bagi Huber > SEhuber.ax1=mad(ax1)/1.486 > SEhuber.ax1 [1] 1.486048 > SEhuber.ax2=mad(ax2)/1.486 > SEhuber.ax2 [1] 1.486048 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 102 > SEhuber.ax3=mad(ax3)/1.486 > SEhuber.ax3 [1] 1.486048 > SEhuber.ax4=mad(ax4)/1.486 > SEhuber.ax4 [1] 1.486048 > SEhuber.ax5=mad(ax5)/1.486 > SEhuber.ax5 [1] 1.486048 #Mencari Nilai Median > median.ax1=median(ax1) > median.ax1 [1] 9.541907 > median.ax2=median(ax2) > median.ax2 [1] 9.541907 > median.ax3=median(ax3) > median.ax3 [1] 9.541907 > median.ax4=median(ax4) > median.ax4 [1] 9.541907 > median.ax5=median(ax5) > median.ax5 [1] 9.541907 #Mencari Nilai Penduga Huber > require(MASS) > huber.ax1=huber(ax1) > huber.ax1 $mu [1] 9.829877 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 103 $s [1] 2.208268 > huber.ax2=huber(ax2) > huber.ax2 $mu [1] 9.829877 $s [1] 2.208268 > huber.ax3=huber(ax3) > huber.ax3 $mu [1] 9.829877 $s [1] 2.208268 > huber.ax4=huber(ax4) > huber.ax4 $mu [1] 9.829877 $s [1] 2.208268 > huber.ax5=huber(ax5) > huber.ax5 $mu [1] 9.829877 $s [1] 2.208268 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 104 #Pembentukan Selang Kepercayaan #Selang Kepercayaan untuk data ax1 #Selang Kepercayaan Biasa > t.test(ax1) One Sample t-test data: ax1 t = 8.5664, df = 9, p-value = 1.276e-05 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 7.742815 13.299517 sample estimates: mean of x 10.52117 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga Median (SE Fraiman et al) > left.Fraiman.ax1=median.ax1-(t*SEmedian.Fraiman.ax1) > left.Fraiman.ax1 [1] 9.173782 > right.Fraiman.ax1=median.ax1+(t*SEmedian.Fraiman.ax1) > right.Fraiman.ax1 [1] 9.910032 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga Median (SE Kendall and Stuart) > right.Kendall.ax1=median.ax1+(t*SEmedian.Kendall.ax1) > right.Kendall.ax1 [1] 12.36362 > left.Kendall.ax1=median.ax1-(t*SEmedian.Kendall.ax1) > left.Kendall.ax1 [1] 6.720189 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 105 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga Huber > left.huber.ax1=huber.ax1$mu-(t*SEhuber.ax1) > left.huber.ax1 [1] 7.105782 > right.huber.ax1=huber.ax1$mu+(t*SEhuber.ax1) > right.huber.ax1 [1] 12.55397 #Selang Kepercayaan untuk data ax2 #Selang Kepercayaan Biasa > t.test(ax2) One Sample t-test data: ax2 t = 5.3631, df = 9, p-value = 0.0004544 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 6.661554 16.380778 sample estimates: mean of x 11.52117 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga median (SE Fraiman et al) > right.Fraiman.ax2=median.ax2+(t*SEmedian.Fraiman.ax2) > right.Fraiman.ax2 [1] 9.910032 > left.Fraiman.ax2=median.ax2-(t*SEmedian.Fraiman.ax2) > left.Fraiman.ax2 [1] 9.173782 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga median (SE Kendall and Stuart) > left.Kendall.ax2=median.ax2-(t*SEmedian.Kendall.ax2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 106 > left.Kendall.ax2 [1] 4.606443 > right.Kendall.ax2=median.ax2+(t*SEmedian.Kendall.ax2) > right.Kendall.ax2 [1] 14.47737 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga Huber > left.huber.ax2=huber.ax2$mu-(t*SEhuber.ax2) > left.huber.ax2 [1] 7.105782 > right.huber.ax2=huber.ax2$mu+(t*SEhuber.ax2) > right.huber.ax2 [1] 12.55397 #Selang Kepercayaan untuk data ax3 #Selang Kepercayaan Biasa > t.test(ax3) One Sample t-test data: ax3 t = 3.2961, df = 9, p-value = 0.009287 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 4.24145 22.80088 sample estimates: mean of x 13.52117 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga median (SE Fraiman et al) > left.Fraiman.ax3=median.ax3-(t*SEmedian.Fraiman.ax3) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 107 > left.Fraiman.ax3 [1] 9.173782 > right.Fraiman.ax3=median.ax3+(t*SEmedian.Fraiman.ax3) > right.Fraiman.ax3 [1] 9.910032 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga median (SE Kendall and Stuart) > right.Kendall.ax3=median.ax3+(t*SEmedian.Kendall.ax3) > right.Kendall.ax3 [1] 18.96647 > left.Kendall.ax3=median.ax3-(t*SEmedian.Kendall.ax3) > left.Kendall.ax3 [1] 0.1173469 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga Huber > left.huber.ax3=huber.ax3$mu-(t*SEhuber.ax3) > left.huber.ax3 [1] 7.105782 > right.huber.ax3=huber.ax3$mu+(t*SEhuber.ax3) > right.huber.ax3 [1] 12.55397 #Selang Kepercayaan untuk data ax4 #Selang Kepercayaan Biasa > t.test(ax4) One Sample t-test data: ax4 t = 2.169, df = 9, p-value = 0.05821 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -0.752429 35.794761 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 108 sample estimates: mean of x 17.52117 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga median (SE Fraiman et al) > right.Fraiman.ax4=median.ax4+(t*SEmedian.Fraiman.ax4) > right.Fraiman.ax4 [1] 9.910032 > left.Fraiman.ax4=median.ax4-(t*SEmedian.Fraiman.ax4) > left.Fraiman.ax4 [1] 9.173782 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga median (SE Kendall and Stuart) > left.Kendall.ax4=median.ax4-(t*SEmedian.Kendall.ax4) > left.Kendall.ax4 [1] -9.016914 > right.Kendall.ax4=median.ax4+(t*SEmedian.Kendall.ax4) > right.Kendall.ax4 [1] 28.10073 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga Huber > left.huber.ax4=huber.ax4$mu-(t*SEhuber.ax4) > left.huber.ax4 [1] 7.105782 > right.huber.ax4=huber.ax4$mu+(t*SEhuber.ax4) > right.huber.ax4 [1] 12.55397 #Selang Kepercayaan untuk data ax5 #Selang Kepercayaan Biasa > t.test(ax5) One Sample t-test data: ax5 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 109 t = 2.0408, df = 9, p-value = 0.07167 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -2.008418 39.050751 sample estimates: mean of x 18.52117 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga median (SE Fraiman et al) > left.Fraiman.ax5=median.ax5-(t*SEmedian.Fraiman.ax5) > left.Fraiman.ax5 [1] 9.173782 > right.Fraiman.ax5=median.ax5+(t*SEmedian.Fraiman.ax5) > right.Fraiman.ax5 [1] 9.910032 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga median (SE Kendall and Stuart) > right.Kendall.ax5=median.ax5+(t*SEmedian.Kendall.ax5) > right.Kendall.ax5 [1] 30.39193 > left.Kendall.ax5=median.ax5-(t*SEmedian.Kendall.ax5) > left.Kendall.ax5 [1] -11.30812 #Selang Kepercayaan Robust bagi parameter lokasi dengan penduga Huber > left.huber.ax5=huber.ax5$mu-(t*SEhuber.ax5) > left.huber.ax5 [1] 7.105782 > right.huber.ax5=huber.ax5$mu+(t*SEhuber.ax5) > right.huber.ax5 [1] 12.55397 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 110 Lampiran 4 Plot simulasi data acak dari Distribusi Normal (n=10, µ=10, σ=2) antara nilai tambahan (x) terhadap Galat standar (SE) > x=c(20,30,50,90,100) #nilai tambahan > SExbar=c(1.228187,2.14822,4.102154,8.077951,9.075225) > SEmedian.Fraiman=c(0.2008196,0.2008196,0.2008196,0.2008196,0.2008196) > SEmedian.Kendall=c(1.539304,2.692395,5.141287,10.12421,11.37411) > SEhuber=c(1.486048,1.486048,1.486048,1.486048,1.486048) > plot(x, SExbar, type="o", col="blue", pch="o", lty=1, ylim=c(0,15), ylab="Galat standar") > points(x,SEmedian.Fraiman, col="red", pch="*") > lines(x, SEmedian.Fraiman, col="red", lty=2) > points(x, SEmedian.Kendall, col="brown", pch="+") > lines(x, SEmedian.Kendall, col="brown", lty=3) > points(x, SEhuber, col="black", pch="^") > lines(x, SEhuber, col="black", lty=4) > legend(21,14,legend=c("SExbar","SEmedian.Fraiman","SEmedian.Kendall","SEh uber"), col=c("blue","red","brown","black"),pch=c("o","*","+","^"),lty=c(1,2,3,4), ncol=1) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 111 Lampiran 5 Hasil Simulasi Data Acak dari Distribusi Normal Tabel 4.1. Pembangkitan Data dari Distribusi Normal (n=10, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 20 30 50 90 100 20 30 50 90 100 20 30 50 90 100 20 30 50 90 100 Selang Kepercayaan 95% Nilai Penduga Galat standar 10.52117 11.52117 13.52117 17.52117 18.52117 9.541907 9.541907 9.541907 9.541907 1.228187 2.14822 4.102154 8.077951 9.075225 0.2008196 0.2008196 0.2008196 0.2008196 9.541907 9.541907 9.541907 9.541907 9.541907 9.541907 9.829877 9.829877 9.829877 9.829877 0.2008196 1.539304 2.692395 5.141287 10.12421 11.37411 1.486048 1.486048 1.486048 1.486048 6.720189 4.606443 0.1173469 -9.016914 -11.30812 7.105782 7.105782 7.105782 7.105782 9.910032 12.36362 14.47737 18.96647 28.10073 30.39193 12.55397 12.55397 12.55397 12.55397 9.829877 1.486048 7.105782 12.55397 Batas Bawah Batas Atas 7.742815 6.661554 4.24145 -0.752429 -2.008418 9.173782 9.173782 9.173782 9.173782 9.173782 13.299517 16.380778 22.80088 35.794761 39.050751 9.910032 9.910032 9.910032 9.910032 Lebar Selang 5.556702 9.719224 18.55943 36.54719 41.059169 0.73625 0.73625 0.73625 0.73625 0.73625 5.643431 9.870927 18.8491231 37.117644 41.70005 5.448188 5.448188 5.448188 5.448188 5.448188 Gambar 4.1. Galat standar dari Distribusi Normal (n=10, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 112 Tabel 4.2. Pembangkitan Data dari Distribusi Normal (n=50, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 100 180 200 300 350 100 180 200 300 350 100 180 200 300 350 100 180 200 300 350 Selang Kepercayaan 95% Nilai Penduga Galat standar 11.25921 12.85921 13.25921 15.25921 16.25921 9.399257 9.399257 9.399257 9.399257 1.829071 3.420646 3.819639 5.816682 6.815854 0.149233 0.149233 0.149233 0.149233 9.399257 9.399257 9.399257 9.399257 9.399257 9.399257 9.413415 9.413415 9.413415 9.413415 0.149233 2.2924 4.287143 4.787208 7.29013 8.542406 1.122698 1.122698 1.122698 1.122698 5.555931 2.211642 1.373259 -2.823017 -4.922522 7.531155 7.531155 7.531155 7.531155 9.649453 13.24258 16.58687 17.42525 21.62153 23.72104 11.29568 11.29568 11.29568 11.29568 9.413415 1.122698 7.531155 11.29568 Batas Bawah Batas Atas 7.583554 5.985164 5.583356 3.570149 2.562238 9.14906 9.14906 9.14906 9.14906 9.14906 14.934864 19.733254 20.935062 26.94827 29.95618 9.649453 9.649453 9.649453 9.649453 Lebar Selang 7.35131 13.74809 15.351706 23.378121 27.393942 0.500393 0.500393 0.500393 0.500393 0.500393 7.686649 14.375228 16.051991 24.444547 28.643562 3.764525 3.764525 3.764525 3.764525 3.764525 Gambar 4.2. Galat standar dari Distribusi Normal (n=50, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 113 Tabel 4.3. Pembangkitan Data dari Distribusi Normal (n=100, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 150 180 200 300 350 150 180 200 300 350 150 180 200 300 350 150 180 200 300 350 Nilai Penduga Galat standar 11.574 11.874 12.074 13.074 13.574 10.08675 10.08675 10.08675 10.08675 1.40904 1.707144 1.90621 2.903467 3.4027 0.01746087 0.01746087 0.01746087 0.01746087 10.08675 10.08675 10.08675 10.08675 10.08675 10.08675 10.17211 10.17211 10.17211 10.17211 0.01746087 1.76597 2.139588 2.38908 3.638957 4.264652 1.099026 1.099026 1.099026 1.099026 10.17211 1.099026 Selang Kepercayaan 95% Batas Bawah Batas Atas 8.778154 8.486652 8.291661 7.312887 6.822301 10.05776 10.05776 10.05776 10.05776 10.05776 14.369837 15.26134 15.85633 18.835105 20.32569 10.11575 10.11575 10.11575 10.11575 7.154553 6.534202 6.119947 4.044663 3.005765 8.347296 8.347296 8.347296 8.347296 10.11575 13.01896 13.63931 14.05356 16.12885 17.16774 11.99692 11.99692 11.99692 11.99692 8.347296 11.99692 Lebar Selang 5.591683 6.774688 7.564669 11.522218 13.503389 0.05799 0.05799 0.05799 0.05799 0.05799 5.864407 7.105108 7.933613 12.084187 14.161975 3.649624 3.649624 3.649624 3.649624 3.649624 Gambar 4.3. Galat standar dari Distribusi Normal (n=100, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 114 Tabel 4.4. Pembangkitan Data dari Distribusi Normal (n=500, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 680 750 800 1000 1050 680 750 800 1000 1050 680 750 800 1000 1050 680 750 800 1000 1050 Nilai Penduga Galat standar 11.27603 11.41603 11.51603 11.91603 12.01603 9.889217 9.889217 9.889217 9.889217 1.343203 1.482913 1.582737 1.982211 2.082111 0.106006 0.106006 0.106006 0.106006 9.889217 9.889217 9.889217 9.889217 9.889217 9.889217 9.951158 9.951158 9.951158 9.951158 0.106006 1.683456 1.858556 1.983667 2.484333 2.609539 1.447588 1.447588 1.447588 1.447588 9.951158 1.447588 Selang Kepercayaan 95% Batas Bawah Batas Atas 8.637003 8.502511 8.406384 8.021527 7.92525 9.714528 9.714528 9.714528 9.714528 9.714528 13.915065 14.329557 14.625684 15.810542 16.10682 10.06391 10.06391 10.06391 10.06391 7.115028 6.826478 6.620307 5.795253 5.588924 7.565659 7.565659 7.565659 7.565659 10.06391 12.66341 12.95196 13.15813 13.98318 14.18951 12.33666 12.33666 12.33666 12.33666 7.565659 12.33666 Lebar Selang 5.278062 5.827046 6.2193 7.789015 8.18157 0.349382 0.349382 0.349382 0.349382 0.349382 5.548382 6.125482 6.537823 8.187927 8.600586 4.771001 4.771001 4.771001 4.771001 4.771001 Gambar 4.4. Galat standar dari Distribusi Normal (n=500, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 115 Lampiran 6 Hasil Simulasi Data Acak dari Distribusi Cauchy Tabel 4.5. Pembangkitan Data dari Distribusi Cauchy (n=10, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 20 30 50 90 100 20 30 50 90 100 20 30 50 90 100 20 30 50 90 100 Nilai Penduga Galat standar 7.993803 2.129139 4.129139 8.129139 9.129139 8.61436 8.61436 8.61436 8.61436 Selang Kepercayaan 95% Batas Bawah Batas Atas 1.960875 2.740999 4.566088 8.457029 9.444013 0.1966047 0.1966047 0.1966047 0.1966047 3.557995 -5.877356 -8.034837 -12.81115 -14.03798 8.253962 8.253962 8.253962 8.253962 12.42961 10.135635 16.293116 29.06942 32.29626 8.974759 8.974759 8.974759 8.974759 8.61436 8.61436 8.61436 8.61436 8.61436 8.61436 7.524453 7.524453 7.524453 7.524453 0.1966047 2.457592 3.435333 5.722743 10.59931 11.83632 3.150254 3.150254 3.150254 3.150254 8.253962 4.109316 2.317007 -1.876074 -10.81538 -13.08294 1.749682 1.749682 1.749682 1.749682 8.974759 13.1194 14.91171 19.10479 28.0441 30.31166 13.29922 13.29922 13.29922 13.29922 7.524453 3.150254 1.749682 13.29922 Lebar Selang 8.871615 16.012991 24.327953 41.88057 46.33424 0.720797 0.720797 0.720797 0.720797 0.720797 9.010084 12.594703 20.980864 38.85948 43.3946 11.549538 11.549538 11.549538 11.549538 11.549538 Gambar 4.5. Galat standar dari Distribusi Cauchy (n=10, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 116 Tabel 4.6. Pembangkitan Data dari Distribusi Cauchy (n=50, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 100 180 200 300 350 100 180 200 300 350 100 180 200 300 350 100 180 200 300 350 Selang Kepercayaan 95% Nilai Penduga Galat standar 10.2516 2.129139 10.6516 12.6516 13.6516 9.816656 9.816656 9.816656 9.816656 3.857795 4.838202 5.132212 6.767319 7.650171 0.01654206 0.01654206 0.01654206 0.01654206 0.528874 -5.877356 0.3380385 -0.947833 -1.72199 9.788922 9.788922 9.788922 9.788922 9.816656 9.816656 9.816656 9.816656 9.816656 9.816656 9.412648 9.412648 9.412648 9.412648 0.01654206 4.835029 6.063786 6.432273 8.481577 9.588067 2.157443 2.157443 2.157443 2.157443 9.788922 -0.349591 2.317007 -0.9673783 -4.40314 -6.258227 5.795584 5.795584 5.795584 5.795584 9.412648 2.157443 5.795584 Batas Bawah Batas Atas Lebar Selang 19.44546 19.974334 10.135635 16.012991 20.9651696 20.6271311 26.251041 27.198874 30.74719 29.0252 0.055467 9.844389 0.055467 9.844389 0.055467 9.844389 0.055467 9.844389 0.055467 9.844389 20.332491 19.9829 12.594703 14.91171 20.60069 21.5680683 28.43959 24.03645 32.149767 25.89154 7.234126 13.02971 7.234126 13.02971 7.234126 13.02971 7.234126 13.02971 7.234126 13.02971 Gambar 4.6. Galat standar dari Distribusi Cauchy (n=50, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 117 Tabel 4.7. Pembangkitan Data dari Distribusi Cauchy (n=100, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 150 180 200 300 350 150 180 200 300 350 150 180 200 300 350 150 180 200 300 350 Nilai Penduga Galat standar 5.952787 6.252787 6.452787 7.452787 7.952787 9.563134 9.563134 9.563134 9.563134 Selang Kepercayaan 95% Batas Bawah Batas Atas 7.324704 7.390149 7.440183 7.763141 7.966893 0.2885671 0.2885671 0.2885671 0.2885671 -8.581015 -8.410872 -8.310149 -7.950969 -7.855257 9.084 9.084 9.084 9.084 20.48659 20.916447 21.215724 22.856544 23.760831 10.04227 10.04227 10.04227 10.04227 9.563134 9.563134 9.563134 9.563134 9.563134 9.563134 9.541773 9.541773 9.541773 9.541773 0.2885671 9.180156 9.262179 9.324886 9.729655 9.98502 2.08141 2.08141 2.08141 2.08141 9.084 -5.679515 -5.815705 -5.919824 -6.591898 -7.015904 6.085818 6.085818 6.085818 6.085818 10.04227 24.80578 24.94197 25.04609 25.71817 26.14217 12.99773 12.99773 12.99773 12.99773 9.541773 2.08141 6.085818 12.99773 Lebar Selang 29.067605 29.327319 29.525873 30.807513 31.616088 0.95827 0.95827 0.95827 0.95827 0.95827 30.485295 30.757675 30.965914 32.310068 33.158074 6.911912 6.911912 6.911912 6.911912 6.911912 Gambar 4.7. Galat standar dari Distribusi Cauchy (n=100, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 118 Tabel 4.8. Pembangkitan Data dari Distribusi Cauchy (n=500, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 680 750 800 1000 1050 680 750 800 1000 1050 680 750 800 1000 1050 680 750 800 1000 1050 Nilai Penduga Galat standar 9.065528 9.205528 9.305528 9.705528 9.805528 10.00257 10.00257 10.00257 10.00257 Selang Kepercayaan 95% Batas Bawah Batas Atas 1.922967 2.023334 2.097806 2.414216 2.497068 0.09471295 0.09471295 0.09471295 0.09471295 5.287417 5.230225 5.183906 4.962247 4.899465 9.846494 9.846494 9.846494 9.846494 12.843639 13.180832 13.42715 14.448809 14.711592 10.15865 10.15865 10.15865 10.15865 10.00257 10.00257 10.00257 10.00257 10.00257 10.00257 10.04852 10.04852 10.04852 10.04852 0.09471295 2.410082 2.535873 2.62921 3.025771 3.129611 1.897944 1.897944 1.897944 1.897944 9.846494 6.030966 5.823674 5.669862 5.016365 4.845246 6.920869 6.920869 6.920869 6.920869 10.15865 13.97418 14.18147 14.33528 14.98878 15.1599 13.17616 13.17616 13.17616 13.17616 10.04852 1.897944 6.920869 13.17616 Lebar Selang 7.556222 7.950607 8.243244 9.486562 9.812127 0.312156 0.312156 0.312156 0.312156 0.312156 7.943214 8.357796 8.665418 9.972415 10.314654 6.255291 6.255291 6.255291 6.255291 6.255291 Gambar 4.8. Galat standar dari Distribusi Cauchy (n=500, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 119 Lampiran 7 Hasil Simulasi Data Acak dari Distribusi Chi-Square Tabel 4.9. Pembangkitan Data dari Distribusi Chi-Square (n=10, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 20 30 50 90 100 20 30 50 90 100 20 30 50 90 100 20 30 50 90 100 Selang Kepercayaan 95% Nilai Penduga Galat standar 10.52117 11.52117 13.52117 17.52117 18.52117 5.74352 5.74352 5.74352 5.74352 2.013593 2.779988 4.590847 8.471775 9.457523 0.9744533 0.9744533 0.9744533 0.9744533 5.74352 5.74352 5.74352 5.74352 5.74352 5.74352 6.493084 6.493084 6.493084 6.493084 0.9744533 2.523665 3.484198 5.753774 10.6178 11.85325 2.482404 2.482404 2.482404 2.482404 6.720189 4.606443 0.1173469 -9.016914 -11.30812 7.105782 7.105782 7.105782 7.105782 9.910032 12.36362 14.47737 18.96647 28.10073 30.39193 12.55397 12.55397 12.55397 12.55397 6.493084 2.482404 7.105782 12.55397 Batas Bawah Batas Atas 7.742815 6.661554 4.24145 -0.752429 -2.008418 9.173782 9.173782 9.173782 9.173782 9.173782 13.299517 16.380778 22.80088 35.794761 39.050751 9.910032 9.910032 9.910032 9.910032 Lebar Selang 5.556702 9.719224 18.55943 36.54719 41.059169 0.73625 0.73625 0.73625 0.73625 0.73625 5.643431 9.870927 18.8491231 37.117644 41.70005 5.448188 5.448188 5.448188 5.448188 5.448188 Gambar 4.9. Galat standar dari Distribusi Chi-Square (n=10, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 120 Tabel 4.10. Pembangkitan Data dari Distribusi Chi-Square (n=50, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 100 180 200 300 350 100 180 200 300 350 100 180 200 300 350 100 180 200 300 350 Nilai Penduga Galat standar 49.21651 50.81651 51.21651 53.21651 Selang Kepercayaan 95% Batas Bawah Batas Atas 54.21651 46.30712 46.30712 46.30712 46.30712 1.793433 3.01544 3.370756 5.244767 6.211311 1.01155 1.01155 1.01155 1.01155 45.61247 44.75676 44.44272 42.67676 41.73441 44.6112 44.6112 44.6112 44.6112 52.82055 56.87626 57.9903 63.75626 66.69861 48.00303 48.00303 48.00303 48.00303 46.30712 46.30712 46.30712 46.30712 46.30712 46.30712 48.26307 48.26307 48.26307 48.26307 1.01155 2.247736 3.779293 4.224616 6.573341 7.784724 7.6356 7.6356 7.6356 7.6356 44.6112 42.53867 39.97094 39.22433 35.28658 33.25563 35.4616 35.4616 35.4616 35.4616 48.00303 50.07556 52.64329 53.3899 57.32766 59.3586 61.06454 61.06454 61.06454 61.06454 48.26307 7.6356 35.4616 61.06454 Lebar Selang 7.20808 12.1195 13.54758 21.0795 24.9642 3.39183 3.39183 3.39183 3.39183 3.39183 7.53689 12.67235 14.16557 22.04108 26.10297 25.60294 25.60294 25.60294 25.60294 25.60294 Gambar 4.10. Galat standar dari Distribusi Chi-Square (n=50, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 121 Tabel 4.11. Pembangkitan Data dari Distribusi Chi-Square (n=100, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 150 180 200 300 350 150 180 200 300 350 150 180 200 300 350 150 180 200 300 350 Nilai Penduga Galat standar 99.9281 100.2281 100.4281 101.4281 101.9281 98.95515 98.95515 98.95515 98.95515 1.309796 1.45225 1.57205 2.341558 2.781847 0.3659062 0.3659062 0.3659062 0.3659062 98.95515 98.95515 98.95515 98.95515 98.95515 98.95515 99.41169 99.41169 99.41169 99.41169 0.3659062 1.641586 1.820126 1.970273 2.934708 3.486528 8.412008 8.412008 8.412008 8.412008 99.41169 8.412008 Selang Kepercayaan 95% Batas Bawah Batas Atas 97.32918 97.34652 97.30881 96.78194 96.40831 98.34761 98.34761 98.34761 98.34761 98.34761 102.52702 103.10968 103.54739 106.07426 107.44789 99.5627 99.5627 99.5627 99.5627 96.22948 95.93303 95.68373 94.08239 93.16615 85.44447 85.44447 85.44447 85.44447 99.5627 101.6808 101.9773 102.2266 103.8279 104.7442 113.3789 113.3789 113.3789 113.3789 85.44447 113.3789 Lebar Selang 5.19784 5.76316 6.23858 9.29232 11.03958 1.21509 1.21509 1.21509 1.21509 1.21509 5.45132 6.04427 6.54287 9.74551 11.57805 27.93443 27.93443 27.93443 27.93443 27.93443 Gambar 4.11. Galat standar dari Distribusi Chi-Square (n=100, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 122 Tabel 4.12. Pembangkitan Data dari Distribusi Chi-Square (n=500, µ=10, σ=2) Metode Nilai SK Tambahan 1 2 3 4 680 750 800 1000 1050 680 750 800 1000 1050 680 750 800 1000 1050 680 750 800 1000 1050 Nilai Penduga Galat standar 498.5649 498.7049 498.8049 499.2049 499.3049 498.5799 498.5799 498.5799 498.5799 1.4622 1.503142 1.539531 1.735809 1.795481 0.1323977 0.1323977 0.1323977 0.1323977 498.5799 498.5799 498.5799 498.5799 498.5799 498.5799 498.32 498.32 498.32 498.32 0.1323977 1.832596 1.883909 1.929516 2.175514 2.250302 22.00634 22.00634 22.00634 22.00634 498.32 22.00634 Selang Kepercayaan 95% Batas Bawah Batas Atas 495.692 495.7516 495.7801 495.7945 495.7772 498.3617 498.3617 498.3617 498.3617 498.3617 501.4377 501.6581 501.8296 502.6152 502.8325 498.7981 498.7981 498.7981 498.7981 495.5599 495.4754 495.4002 494.9948 494.8716 462.0554 462.0554 462.0554 462.0554 498.7981 501.5999 501.6844 501.7596 502.165 502.2882 534.5845 534.5845 534.5845 534.5845 462.0554 534.5845 Lebar Selang 5.7457 5.9065 6.0495 6.8207 7.0553 0.4364 0.4364 0.4364 0.4364 0.4364 6.04 6.209 6.3594 7.1702 7.4166 72.5291 72.5291 72.5291 72.5291 72.5291 Gambar 4.12. Galat standar dari Distribusi Chi-Square (n=500, µ=10, σ=2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 123 TABEL 𝒁 z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 -3.8 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 -3.7 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 -3.6 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 -3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 -3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002 -3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003 -3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005 -3.1 0.001 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007 -3 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.001 0.001 -2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014 -2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.002 0.0019 -2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.003 0.0029 0.0028 0.0027 0.0026 -2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.004 0.0039 0.0038 0.0037 0.0036 -2.5 0.0062 0.006 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048 -2.4 0.0082 0.008 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064 -2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084 -2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.011 -2.1 0.0179 0.0174 0.017 0.0166 0.0162 0.0158 0.0154 0.015 0.0146 0.0143 -2 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183 -1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.025 0.0244 0.0239 0.0233 -1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294 -1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367 -1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455 -1.5 0.0668 0.0655 0.0643 0.063 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559 -1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681 -1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823 -1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.102 0.1003 0.0985 -1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.123 0.121 0.119 0.117 -1 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379 -0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.166 0.1635 0.1611 -0.8 0.2119 0.209 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867 -0.7 0.242 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148 -0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451 -0.5 0.3085 0.305 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.281 0.2776 -0.4 0.3446 0.3409 0.3372 0.3336 0.33 0.3264 0.3228 0.3192 0.3156 0.3121 -0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.352 0.3483 -0.2 0.4207 0.4168 0.4129 0.409 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 -0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247 0 0.5 0.496 0.492 0.488 0.484 0.4801 0.4761 0.4721 0.4681 0.4641 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 124 (lanjutan) TABEL 𝒁 z 0 0 0.5 0.01 0.504 0.02 0.508 0.03 0.512 0.04 0.516 0.05 0.5199 0.06 0.5239 0.07 0.5279 0.08 0.5319 0.09 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.591 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.648 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.67 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.695 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.719 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.758 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.791 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.834 0.8365 0.8389 1 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.877 0.879 0.881 0.883 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.898 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.937 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.975 0.9756 0.9761 0.9767 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2 0.9772 0.9778 2.1 0.9821 0.9826 0.983 0.9834 0.9838 0.9842 0.9846 0.985 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.989 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.992 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.994 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.996 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.997 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.998 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.999 0.999 3.1 0.999 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 125 TABEL DISTRIBUSI-𝒕 df 𝜶 0.2 1.376 0.15 1.963 0.1 3.078 0.05 6.31 0.025 12.7 0.02 15.9 0.01 31.82 0.005 63.65 0.0025 127.3 0.001 0.0005 1 0.25 1 318.3 636.619 2 3 0.817 0.765 1.061 0.979 1.386 1.25 1.886 1.638 2.92 2.353 4.303 3.182 4.849 3.482 6.965 4.541 9.925 5.841 14.08 7.453 22.33 10.22 31.599 12.924 4 0.741 0.941 1.19 1.533 2.132 2.776 2.999 3.747 4.604 5.598 7.173 8.61 5 6 0.727 0.718 0.92 0.906 1.156 1.134 1.476 1.44 2.015 1.943 2.571 2.447 2.757 2.612 3.365 3.143 4.032 3.707 4.773 4.317 5.893 5.208 6.869 5.959 7 8 0.711 0.706 0.896 0.889 1.119 1.108 1.415 1.397 1.895 1.86 2.365 2.306 2.517 2.449 2.998 2.896 3.499 3.355 4.029 3.833 4.785 4.501 5.408 5.041 9 10 0.703 0.7 0.883 0.879 1.1 1.093 1.383 1.372 1.833 1.812 2.262 2.228 2.398 2.359 2.821 2.764 3.25 3.169 3.69 3.581 4.297 4.144 4.781 4.587 11 0.697 0.876 1.088 1.363 1.796 2.201 2.328 2.718 3.106 3.497 4.025 4.437 12 13 0.696 0.694 0.873 0.87 1.083 1.079 1.356 1.35 1.782 1.771 2.179 2.16 2.303 2.282 2.681 2.65 3.055 3.012 3.428 3.372 3.93 3.852 4.318 4.221 14 15 0.692 0.691 0.868 0.866 1.076 1.074 1.345 1.341 1.761 1.753 2.145 2.131 2.264 2.249 2.624 2.602 2.977 2.947 3.326 3.286 3.787 3.733 4.14 4.073 16 0.69 0.865 1.071 1.337 1.746 2.12 2.235 2.583 2.921 3.252 3.686 4.015 17 18 0.689 0.688 0.863 0.862 1.069 1.067 1.333 1.33 1.74 1.734 2.11 2.101 2.224 2.214 2.567 2.552 2.898 2.878 3.222 3.197 3.646 3.61 3.965 3.922 19 20 0.688 0.687 0.861 0.86 1.066 1.064 1.328 1.325 1.729 1.725 2.093 2.086 2.205 2.197 2.539 2.528 2.861 2.845 3.174 3.153 3.579 3.552 3.883 3.85 21 22 0.686 0.686 0.859 0.858 1.063 1.061 1.323 1.321 1.721 1.717 2.08 2.074 2.189 2.183 2.518 2.508 2.831 2.819 3.135 3.119 3.527 3.505 3.819 3.792 23 0.685 0.858 1.06 1.319 1.714 2.069 2.177 2.5 2.807 3.104 3.485 3.768 24 25 0.685 0.684 0.857 0.856 1.059 1.058 1.318 1.316 1.711 1.708 2.064 2.06 2.172 2.167 2.492 2.485 2.797 2.787 3.091 3.078 3.467 3.45 3.745 3.725 26 27 0.684 0.684 0.856 0.855 1.058 1.057 1.315 1.314 1.706 1.703 2.056 2.052 2.162 2.158 2.479 2.473 2.779 2.771 3.067 3.057 3.435 3.421 3.707 3.69 28 0.683 0.855 1.056 1.313 1.701 2.048 2.154 2.467 2.763 3.047 3.408 3.674 29 30 0.683 0.683 0.854 0.854 1.055 1.055 1.311 1.31 1.699 1.697 2.045 2.042 2.15 2.147 2.462 2.457 2.756 2.75 3.038 3.03 3.396 3.385 3.659 3.646 40 50 0.681 0.679 0.851 0.849 1.05 1.047 1.303 1.299 1.684 1.676 2.021 2.009 2.123 2.109 2.423 2.403 2.704 2.678 2.971 2.937 3.307 3.261 3.551 3.496 60 80 0.679 0.678 0.848 0.846 1.045 1.043 1.296 1.292 1.671 1.664 2 1.99 2.099 2.088 2.39 2.374 2.66 2.639 2.915 2.887 3.232 3.195 3.46 3.416 100 0.677 0.845 1.042 1.29 1.66 1.984 2.081 2.364 2.626 2.871 3.174 3.39 1000 ∞ 0.675 0.674 0.842 0.841 1.037 1.036 1.282 1.282 1.646 1.645 1.962 1.96 2.056 2.054 2.33 2.326 2.581 2.576 2.813 2.807 3.098 3.09 3.3 3.291