METODE LINIERISASI ESTIMATOR VARIANS UNTUK MODEL PARAMETER DATA SURVEI RUWET TESIS Oleh DAPOT SITUNGKIR 077021054/MT SEKOLAH PASCASARJANA UNIVERSITAS SUMATERA UTARA MEDAN 2009 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 METODE LINIERISASI ESTIMATOR VARIANS UNTUK MODEL PARAMETER DATA SURVEI RUWET TESIS Diajukan Sebagai Salah Satu Syarat untuk Memperoleh Gelar Magister Sains dalam Program Studi Magister Matematika pada Sekolah Pascasarjana Universitas Sumatera Utara Oleh DAPOT SITUNGKIR 077021054/MT SEKOLAH PASCASARJANA UNIVERSITAS SUMATERA UTARA MEDAN 2009 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 Judul Tesis : METODE LINIERISASI ESTIMATOR VARIANS UNTUK MODEL PARAMETER DATA SURVEI RUWET Nama Mahasiswa : Dapot Situngkir Nomor Pokok : 077021054 Program Studi : Matematika Menyetujui, Komisi Pembimbing (Dr. Sutarman, M.Sc) Ketua Ketua Program Studi (Prof. Dr. Herman Mawengkang) (Prof. Dr. Herman Mawengkang) Anggota Direktur (Prof. Dr. Ir. T.Chairun Nisa. B,M.Sc) Tanggal lulus: 28 Mei 2009 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 Telah diuji pada Tanggal 28 Mei 2009 PANITIA PENGUJI TESIS Ketua : Dr. Sutarman, M.Sc Anggota : 1. Prof. Dr. Herman Mawengkang 2. Prof. Dr. Opim Salim S, M.Sc 3. Drs. Open Darnius, M.Sc Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 ABSTRAK Dalam pengambilan sampel survei, linierisasi Taylor sering digunakan untuk menentukan estimator varians dari estimator kalibrasi total dan parameter populasi berhingga nonlinier (atau sensus), seperti ratio, koefisien regresi dan koefisien korelasi, yang dapat dinyatakan sebagai fungsi mulus dari total. Linierisasi Taylor umumnya dapat diaplikasikan pada setiap rancangan pengambilan sampel, tetapi bisa menghasilkan estimator varians ganda yang dirancang secara otomatis tak bias dalam pengambilan sampel berulang. Pemilihan antara estimator-estimator varians membutuhkan pertimbangan seperti (i) perkiraan ketakbiasan untuk varians model estimator dengan model yang diasumsikan, dan (ii) keabsahan dengan kerangka pengambilan sampel berulang bersyarat. Demnati dan Rao (2002) mengkaji kasus respon yang hilang bila digunakan penyesuaian atas nonrespon total dan imputation untuk nonrespon item yang didasarkan pada fungsi mulus dari nilai-nilai yang diamati, khususnya imputation ratio. Demnati dan Rao (2004) mengajukan pendekatan baru untuk mengembangkan estimator varians linierisasi Taylor yang secara langsung menghasilkan estimator varians tunggal yang memenuhi pertimbangan di atas untuk rancangan umum. Sewaktu menganalisa data survei, populasi berhingga kerapkali diasumsikan dihasilkan dari model superpopulasi, dan kesimpulan analitik atas parameter-parameter model penting diperhatikan. Jika fraksi pengambilan sampel kecil, maka varians pengambilan sampel menangkap hampir semua variasi yang dihasilkan oleh proses acak rancangan dan model. Akan tetapi, bila fraksi pengambilan sampel tidak memenuhi syarat, varians model haruslah diperhitungkan untuk memperoleh kesimpulan yang sah atas parameter-parameter model dalam kedua proses acak. Tesis ini memfokuskan pada total taksiran varians dengan menggunakan pendekatan Demnati-Rao bila sifat-sifat yang diperhatikan diasumsikan merupakan variabel-variabel acak yang dihasilkan dari model superpopulasi. Juga diillustrasikan metode dengan menggunakan estimator ratio dan estimator yang didefinisikan sebagai penyelesaian untuk persamaan penaksiran berbobot kalibrasi. Aplikasi pada model Poisson dengan inflasi nol juga diberikan. Kata kunci: Pengujian, persamaaan estimasi berbobot, estimator ratio , Varians total, Inflated Poisson - Nol i Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 ABSTRACT In survey sampling, Taylor linearization is often used to obtain variance estimators for calibration estimators of totals and nonlinear finite population (or census) parameters, such as ratios, regression and correlation coefficients, which can be expressed as smooth functions of totals. Taylor linearization is generally applicable to any sampling design, but it can lead to multiple variance estimators that are asymptotically design unbiased under repeated sampling. The choice among the variance estimators requires other considerations such as (i) approximate unbiasedness for the model variance of the estimator under an assumed model, and (ii) validity under a conditional repeated sampling framework. Demnati and Rao (2002) considered the case of missing responses when adjustment for complete nonrseponses and imputation for item nonresponse based on smooth functions of observed values, in particular ratio imputation, are used. Afterward, Demnati and Rao (2004) proposed a new approach to deriving Taylor linearization variance estimators that leads directly to a unique variance estimator that satisfies the above considerations for general design. When analyzing survey data, finite populations are often assumed to be generated from super population models, and analytical inferences on model parameters are of interest. If the sampling fractions are small, then the sampling variance captures almost the entire variation generated by the design and model ramdom processes. However, when the sampling fractions are not negligible, the model variance should be taken into account in order to construct valid inferences on the model parameters under both randomization processes. This thesis, focuses on total variance estimation using the Demnati-Rao approach when the characteristics of interest are assumed to be random variables generated from a superpopulation model. The writer illustrate the method using ratio estimators and estimators defined as solutions to calibration weighted estimating equations. Application to a zero-inflated Poisson model is also given. Keyword: Calibration, Weighted estimating equations; Ratio estimators; Total variance; Zero inflated-Poisson. ii Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 KATA PENGANTAR Penulis menyampaikan rasa syukur yang tiada berhingga ke Hadirat Tuhan Yang Maha Kuasa yang telah melimpahkan rahmat-Nya hingga tesis ini dapat diselesaikan dengan baik. Dalam menyelesaikan tesis ini penulis banyak mendapat dukungan dari berbagai pihak, maka pada kesempatan ini penulis mengucapkan terimakasih dan penghargaan yang sebesar-besarnya kepada : Prof. dr. Chairuddin P. Lubis, DTM&H, Sp.A(K) selaku Rektor dan Prof. Dr. Ir. T. Chairun Nisa. B, M.Sc selaku Direktur Sekolah Pascasarjana Universitas Sumatera Utara (USU) yang telah memberi kesempatan kepada penulis untuk mengikuti Program Studi Magister Matematika ini. Prof. Dr. Herman Mawengkang selaku Ketua Program Studi Magister Matematika SPs USU, juga sebagai Dosen Pembimbing-II yang telah memberikan bimbingan dan petunjuk kepada penulis sehingga tesis ini dapat diselesaikan. Dr. Saib Suwilo, M.Sc selaku Sekretaris Program Studi Magister Matematika SPs USU, yang telah memberikan bimbingan, arahan dan masukan sehingga tesis ini dapat diselesaikan. Dr. Sutarman, M.Sc sebagai Dosen Pembimbing I yang telah memberikan bimbingan dan petunjuk kepada penulis sehingga tesis ini dapat diselesaikan. Seluruh Staf Pengajar Program Studi Magister Matematika SPs USU, yang telah membekali ilmu pengetahuan kepada penulis selama perkuliahan sehingga selesai, dan Missiani, S.Si sebagai Staff administrasi. iii Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 Teman-teman mahasiswa atas kerjasama dan kebersamaan yang terjalin indah selama perkuliahan hingga selesai. Kepada orangtua penulis yang sangat penulis cintai, atas segala kasih sayangnya dan perjuangan yang penulis rasakan selama hidupnya. Kepada istriku tercinta Dra. Risma Hotma Ida Marpaung yang se- lalu mendukung dan memberikan semangat yang luar biasa selama perkuliahan dan selama penyusunan tesis ini, kepada anak-anakku juga Imam Rio Wahyudi Situngkir, Adelina Marchelia Situngkir, dan Olivia Geraldine Situngkir. Hanya syukur dan terimakasih yang penulis dapat sampaikan kepada semua pihak untuk dukungan doa, bimbingan maupun arahan yang penulis dapatkan selama ini. Semoga tesis ini bermanfaat bagi pembaca dan pihak-pihak yang memerlukannya. Medan, Mei 2009 Penulis, Dapot Situngkir iv Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 RIWAYAT HIDUP Penulis bernama lengkap Dapot Situngkir lahir di Paropo (Dairi) pada tanggal 20 Pebruari 1968 anak ke-empat dari empat bersaudara, nama ayah St. A. Situngkir (+) dan ibu E. Br Simbolon (+). Tamat Sekolah Dasar (SD) pada tahun 1981 melanjut ke SMP Negeri 5 Medan, dan tahun 1982 pindah ke SMP Negeri 4 Medan, tapi tamat dari SMP Negeri Tigalingga, Dairi pada tahun 1984. Kemudian masuk SMA Negeri Sumbul tamat pada tahun 1987. Pada tahun 1987 melanjutkan pendidikan di USU Medan pada Fakultas MIPA Jurusan Matematika Program Diploma III tamat 1990, melanjutkan pendidikan tingkat sarjana (Sarjana Pendidikan) di Universitas Muslim Nusantara (UMN) Al - Washliyah Medan tahun 2004. Pada saat ini penulis juga sedang mengikuti perkuliahan S2 pada Sekolah Pasca Sarjana Universitas Sumatera Utara Program Magister Sains Jurusan Matematika. Riwayat pekerjaan dimulai sejak tahun 1991 menjadi guru PNS di SMA Negeri Labuhanhaji, Aceh Selatan D.I Aceh dan pada tahun 1995 berpindah tugas ke SMA Swasta Nasrani 1 Medan dengan status PNS-DPK hingga sekarang. Ketika di Aceh, tepatnya tahun 1993 s.d 1994 menjadi tenaga Tutorial pada program penyetaraan D1 bagi guru-guru SD di Tapaktuan - Blang Pidie, sekaligus menjadi Guru Inti di SPKG Matematika Aceh Selatan. Tahun Ajaran 1993/1994 PKS Kesiswaan di SMAN Labuhanhaji, dan di SMA Swasta Nasrani 1 Medan, sejak tahun 1998 sampai dengan tahun 2003 menjadi Wakil Kepala Sekolah, kemudian tahun 2003 sampai dengan 2008 diangkat menjadi Kepala Sekolah. Penulis menikah dalam pemberkatan kudus di Gereja Efrata Martubung Medan tahun 1998 dengan istri tercinta Dra. Risma Hotma Ida putri bungsu dari mertua saya W. Marpaung / N. br Siregar (+) dikaruniakan Tuhan 1 (satu) putra yang ganteng dan 2 (dua) putri yang cantik-cantik masing-masing kami beri nama Imam Rio Wahyudi, Adelina Marchelia, dan Olivia Geraldine. vi Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 Saat ini penulis bersama keluarga tinggal di rumah sederhana di jalan Veteran Pasar X Gang Budi No. 23 Lingkungan V Kelurahan Kota Bangun Medan Deli, Medan. Telepon (061) 6842442. vii Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 DAFTAR ISI Halaman ABSTRAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii KATA PENGANTAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii RIWAYAT HIDUP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii DAFTAR TABEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix BAB 1 PENDAHULUAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Latar Belakang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Rumusan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Tujuan Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 Kontribusi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.5 Metodologi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 BAB 2 TINJAUAN PUSTAKA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 BAB 3 ESTIMASI VARIANSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.1 Komponen dari Varians . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.2 Variabilitas Antar-Mean Kelompok . . . . . . . . . . . . . . . . . . . . . 10 3.3 Teknik Linierisasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 BAB 4 PEMBAHASAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4.1 Varians . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4.2 Data Survei Ruwet dengan Linearisasi Taylor . . . . . . . . . . . . . 19 vii Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 4.2.1 Kasus Umum Yang Paling Sederhana . . . . . . . . . . . . . . 21 4.2.2 Kasus dengan Parameter Tambahan . . . . . . . . . . . . . . . 22 BAB 5 KESIMPULAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 DAFTAR PUSTAKA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 viii Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 DAFTAR TABEL Nomor 3.1 Judul Halaman Mean dan Standar Deviasi dari Forced Mid-expiratory Flow (FEF) dari lima kelompok koresponden berbagai kebiasaan merokok (200 orang per kelompok) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 7 BAB 1 PENDAHULUAN 1.1 Latar Belakang Linierisasi dalam matematika dan aplikasinya mengacu pada penaksiran linier suatu fungsi pada satu titik. Dalam sistem dinamik, linierisasi adalah metode yang digunakan untuk penaksiran stabilitas lokal dari titik keseimbangan pada sistem persamaan differensial nonlinier. Metode Linierisasi sering juga digunakan dalam berbagai bidang seperti industri, fisika, ekonomi dan ekologi. Dalam tesis ini metode linierisasi yang digunakan adalah metode Linierisasi Taylor. Metode ini merupakan metode yang terkenal dalam penaksiran varians (estimator variance) dalam statistik yang kompleks (ruwet) seperti estimator ratio, estimator regresi dan estimator koefisien regresi logistik. Linierisasi Taylor umumnya dapat diaplikasikan pada setiap rancangan pengambilan sampel. Linierisasi ini memungkinkan penaksiran varians tak bias untuk estimator linier, dari segi perhitungan juga lebih mudah. Berbeda dengan metode pengambilan sampel lain, seperti Jackknife. Tetapi karena metode tersebut dapat menghasilkan estimator varians ganda yang rancangannya secara asimptot tak bias dengan pengambilan sampel berulang (Demnati dan Rao, 2005), maka pemilihan diantara estimator-estimator varians membutuhkan pertimbangan seperti: a. Perkiraan ketakbiasan untuk varians model estimator dengan model yang diasumsikan, dan b. Keabsahan dengan kerangka pengambilan sampel berulang bersyarat. 1 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 2 Sebagai contoh, dalam hal pengambilan sampel acak sederhana dan estimator ratio ŶR = (ȳ/x̄)X dari total populasi Y , Royall dan Cumberland (1981) menunjukkan bahwa linierisasi estimator varians yang biasa digunakan adalah ϑL = N 2 (n−1 − N −1 )s2z yang tidak mengubah varians bersyarat dari ŶR untuk x̄, berbeda dengan estimator varians Jackknife θJ . Disini ȳ dan x̄ merupakan rata-rata sampel, X adalah total populasi yang diketahui dari variabel tambahan x, 2g adalah sampel varians dari pengurangan zk = yk − (ȳ/x̄)xk dan (n, N) merupakan notasi dari ukuran sampel dan populasi. Pada linierisasi estimator varians Jackknife θJ , diperoleh linierisasi estimator varians yang berbeda yaitu ϑJ = (X̄/x̄)2ϑL yang merupakan taksiran dari varians bersyarat dan variansi tak bersyarat, dimana X̄ = X/N adalah rata-rata x. Sehingga θJL atau θJ mungkin lebih digunakan ketimbang θL . Valliant (1993) memperoleh θJL untuk estimator pasca-stratifikasi dan melakukan studi simulasi untuk menunjukkan bahwa baik θJ maupun θJL memiliki sifat-sifat bersyarat yang baik dengan diketahui taksiran jumlah pasca-strata. Srndal, Swensson dan Wretman (1989) menunjukkan bahwa θJL rancangan asimptot takbias dan model asimptot takbias dalam pengertian Em (ϑJL ) = Vm (Ŷ )R , dimana Em menotasikan ekspektasi model dan Vm (ŶR ) adalah varians model dari ŶR dengan ”model ratio” : Em (yk ) = βxk ; k = 1, ..., N dan yk tidak tergantung pada varians model Vm (yk ) = σ 2 xk , σ 2 > 0, sehingga θJL adalah pilihan yang baik dari segi berbasis rancangan atau dari segi berbasis model. Demnati dan Rao (2004) mengajukan pendekatan baru terhadap penaksiran varians yang dapat dibenarkan secara teoritis dan dalam waktu yang bersamaan menghasilkan secara langsung estimator variansi tipe-θJL untuk rancangan umum. Demnati dan Rao (2004) mengaplikasikan metode dengan pendekatan berbasis ran- Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 3 cangan pada berbagai masalah, yang mencakup estimator kalibrasi regresi atas total Y dan estimator lainnya yang didefinisikan secara eksplisit atau implisit sebagai penyelesaian persamaan taksiran. Diperoleh estimator varians baru untuk kelompok umum estimator kalibrasi yang mencakup rating ratio tergeneralisasi dan generalisasi estimator regresi. Kemudian diperluas metode pengambilan sampel dua fase dan diperoleh estimator varians pengambilan sampel yang lebih memanfaatkan data sampel pada fase pertama dibandingkan dengan linierisasi estimator varians konvensional. Ketika menganalisis data survei, nilai populasi berhingga yaitu y = (y1, ..., yN )T sering diasumsikan dan dihasilkan dari model superpopulasi, dan diupayakan kesimpulan analitik atas parameter-parameter model. Jika fraksi pengambilan sampel dapat diabaikan, varians pengambilan sampel hampir mencakup keseluruhan varians yang dihasilkan proses rancangan dan model yang acak. Akan tetapi, bila fraksi pengambilan sampel tidak kecil, maka varians model tidak dapat diabaikan dalam perbandingan dengan total varians. 1.2 Rumusan Masalah Penelitian ini membahas penggunaan metode linierisasi estimator varians untuk model parameter dari data survei ruwet dan memfokuskan pada total taksiran dengan menggunakan pendekatan Demnati-Rao bila sifat-sifat yang diasumsikan merupakan variabel-variabel acak yang dihasilkan dari model superpopulasi. Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 4 1.3 Tujuan Penelitian Tujuan dalam penelitian ini adalah untuk melinierisasi estimator varians pada model parameter dari data survei ruwet, kemudian mengilustrasikan metode menggunakan estimator ratio dan estimator yang didefinisikan tersebut merupakan penyelesaian untuk estimasi persamaan kalibrasi yang berbobot. 1.4 Kontribusi Adapun kontribusi dalam penelitian ini adalah dapat membantu peneliti atau pembuat keputusan untuk menentukan estimasi parameter model pada data survei ruwet dengan menggunakan metode linierisasi estimator varians. 1.5 Metodologi Penelitian ini bersifat literatur dan dilakukan dengan mengumpulkan informasi dari referensi beberapa buku dan jurnal. Penelitian ini awalnya menjelaskan tentang varians, data survei ruwet, program taklinier integer lalu teknik linierisasi. Selanjutnya diperlihatkan penggunaan metode linierisasi estimator varians untuk model parameter dari data survei ruwet dan pengambilan kesimpulan. Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 BAB 2 TINJAUAN PUSTAKA Demnati dan Rao (2002) menyatakan bahwa dalam survei sampel, linierisasi Taylor sering digunakan untuk memperkirakan parameter populasi terbatas nonlinear seperti rasio, regresi dan koefisien korelasi yang dapat dinyatakan sebagai fungsi mulus total. Hal ini umumnya berlaku untuk setiap sampel desain, namun dapat menghasilkan lebih dari satu estimator varians yang secara asimptot ekivalen berdasarkan pengambilan sampel yang berulang. Pilihan antara estimator varians memerlukan pertimbangan lain seperti properti estimator varians bersyarat. Sebuah pendekatan baru untuk linierisasi Taylor untuk estimator varians diusulkan. Metode ini berdasarkan representasi linierisasi Taylor dalam bentuk turunan parsial sehubungan dengan bobot desain. Ini menyebabkan estimator varians dengan kondisi bersyarat baik dan setuju dengan linierisasi estimator varians Jackknife ketika diberlakukan. Selanjutnya ditentukan metode untuk berbagai problema, yang meliputi estimator kalibrasi umum dari total serta estimator lainnya yang ditetapkan secara eksplisit atau implisit sebagai solusi dari mengestimasi persamaan. Pendekatan dalam penelitian ini merupakan estimator varians yang baru untuk kelas umum dari estimator kalibrasi termasuk rating ratio tergeneralisasi dan generalisasi estimator regresi. Setelah itu Demnati dan Rao (2002) mengkaji kasus respon yang hilang bila digunakan penyesuaian atas nonrespon total dan imputasi untuk nonrespon item yang berdasarkan pada fungsi mulus dari nilai-nilai yang diamati, khususnya imputasi ratio. 5 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 6 Selanjutnya Demnati dan Rao (2003) menyatakan bahwa linerisasi Taylor umumnya berlaku untuk setiap sampel desain, tetapi dapat mengakibatkan beberapa estimator varians yang desain asimptot takbias berdasarkan pengambilan sampel berulang. Pilihan antara estimator varians memerlukan pertimbangan lain seperti (i) mengaproksimasi ketakbiasan untuk model estimator varians dengan model yang diasumsikan (ii) keabsahan dengan kerangka pengambilan sampel berulang bersyarat. Demnati dan Rao (2004) mengajukan sebuah pendekatan baru untuk linerisasi Taylor pada estimator varians yang mengarah langsung pada estimator variansi yang tunggal sehingga memenuhi pertimbangan tersebut. Dalam penelitian ini merupakan perluasan dari Demnati dan Rao (2001) terhadap survei longitudinal yang mengakibatkan pengamatan terikat dan bobot ganda pada unit yang sama. Selanjutnya dipertimbangkan berbagai desain sampel longitudinal, meliputi survei panel, survei panel rumah tangga serta survei putaran. Molina, Smith dan Sugden (2001) memperoleh rumus umum untuk fungsi ratarata dan varians dari data sampel yaitu diag (a(s))y dan untuk total sampel dengan proses gabungan, dimana a(s) = (a1 (s)), ..., aN (s))T , ak (s) = 1 jika elemen k termasuk dalam sampel s dan ak (s) = 0 untuk lainnya. Tidak diragukan lagi bahwa gabungan proses pemilihan sampel dan pembentukan populasi berhingga haruslah menjadi dasar untuk kesimpulan analitik. Akan tetapi dibutuhkan metode yang bisa diaplikasikan secara luas untuk penaksiran total varians. Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 BAB 3 ESTIMASI VARIANSI 3.1 Komponen dari Varians Untuk menguraikan gagasan komponen-komponen varians, berikut ini dibahas sebuah contoh dari ANOVA satu arah. Contoh ini menggambarkan ide tentang efek tetap dan efek acak, pengambilan sampel dari beberapa populasi, dan ide tentang beberapa pengukuran pada masalah yang sama. Tabel 3.1 Mean dan Standar Deviasi dari Forced Mid-expiratory Flow (FEF) dari lima kelompok koresponden berbagai kebiasaan merokok (200 orang per kelompok) Group Tidak Perokok Perokok passip Perokok ringan Perokok sedang Perokok berat Sumber Mean 3,78 3,30 3,23 2,73 2,59 Standard Deviasi 0,79 0,77 0,78 0,81 0,82 Write dan Froeb (1980) tentang pengaruh merokok terhadap pernafasan Efek Tetap CONTOH: MEROKOK DAN FUNGSI PARU White dan Froeb (1980) menggunakan ukuran dari fungsi paru (forced midexpiratory flow atau FEF) untuk mengetahui bagaimana merokok dapat mempengaruhi pernafasan. Untuk itu dipilih lima kelompok orang dengan berbagai kebiasaan merokok dan 200 orang dalam masing-masing kelompok. Dari tabel yang 7 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 8 telah disusun (White dan Froeb, 1980) diperoleh mean dan standar deviasi pada masing-masing kelompok. Dengan melihat kolom sebelah kanan dari atas ke bawah, varians yang diamati dalam kelompok hampir sama, standar deviasi semuanya kira-kira 0,8. Sebaliknya, rata-rata dan varians yang sebenarnya untuk masing-masing kelompok dan bentuk distribusi pengukuran, mendekati distribusi Gauss maka akan diperoleh penjelasan yang lengkap tentang masing-masing populasi. Selanjunya dapat ditarik kesimpulan tentang hubungan antara berbagai populasi, misalnya ditaksir persentase waktu FEF non-perokok yang dipilih secara acak akan lebih besar daripada FEF perokok berat yang dipilih secara acak (sekitar 84 Model Satu-Arah Seimbang Dalam model dengan gaya ANOVA klasik, reaksi yij untuk anggota j dari kelompok i ditulis sebagai : yij = µi + εij , i = 1, 2, . . . , I; j = 1, 2, . . . , J Di mana ij yang tak berkorelasi mempunyai distribusi dengan rata-rata nol dan varians σi2. Hanya ketiadaan korelasi dari ij yang merupakan asumsi serius. Selalu dapat kita definisikan µi untuk menjadikan rata-rata ij sama dengan nol. Karena ukuran sampel sama, rancangan disebut seimbang. Bentuk µi dapat juga diuraikan menjadi dua komponen, yaitu : µi = µ + αi Kemudian model paralel dengan lapisan-lapisan, dengan µ merupakan mean dari µi , nilai persekutuan dalam lapisan-lapisan model paralel dengan grand mean data Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 9 awal. Lambang α menyatakan bahwa penelitian mencakup semua populasi penting. Kemudian, bila diambil sampel populasi, digunakan ai (dan bukan αi ) untuk menyatakan bahwa populasi yang diambil untuk penelitian tidak mencakup semua populasi dalam superpopulasi. Contoh merokok mempunyai I = 5 dan J = 200. Dengan demikian, misalnya jika ij tak terikat I (dan bukan hanyak tak berkorelasi), distribusi FEF untuk tidak perokok akan menjadi F1 (µ1, σ12) dan untuk perokok sedang F4 (µ4, σ42), untuk sebagian F . Jika F berdistribusi Gauss untuk µ1 , . . . , µ5 dan σ12, . . . , σ42 diketahui, dapat diambil dan dibandingkan angka-angka distribusi ini, untuk tidak perokok dan perokok sedang dan akan diperoleh semua informasi yang dibutuhkan untuk memahami masing-masing populasi perokok satu per satu, dan juga hubungan antar kelompok. Untuk banyak analisa varians, asumsi Gauss memegang peran kecil. Untuk data pengukuran, distribusi rata-rata mungkin mendekati normal (Gauss), sekalipun asumsi gagal untuk masing-masing pengukuran. Kemudian penafsiran frekuensi distribusi F teoritis yang digunakan secara konvensional dalam pengujian tergantung pada asumsi normalitas, walaupun tingkat ketergantungan tidak mudah ditentukankan, tapi hal itu tidak menjadi masalah. Jika variasi dalam masing-masing kelompok, σi2 berbeda dari satu kelompok dengan kelompok lain, maka akan ditentukan taksiran σi2 tersebut dari masing-masing kelompok perlakuan. Selanjutnya, jika variasi antar kelompok yang satu dengan kelompok yang lain hampir konstan (seperti contoh diatas), maka untuk menaksir σ 2 cenderung diperoleh dari informasi kelima populasi. Karena yang dibahas adalah sampel dan bukan populasi, maka nilai mean µi maupun σi2 tidak bisa diketahui dengan tepat. Dari segi analisa varians, dapat diketahui nilai-nilai seputar populasinya. Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 10 Adakalanya, jika σi2 bervariasi secara berarti, maka terdapat hubungan selain dari kesamaan antara σi2 , sedemikian sehingga σ12 = 2σ22 = 3σ32, kemudian dapat digabungkan kembali informasi dari sampel-sampel untuk meningkatkan taksiran σi2. 3.2 Variabilitas Antar-Mean Kelompok Dalam topik ini akan dibahas tentang variabilitas di dalam masing-masing kelompok, selanjutnya juga dijelaskan tentang variasi kelompok dengan kelompok. Satu ukuran keanekaragaman kelompok adalah variasi dari mean kelompok µi sekitar P rata-ratanya µ = Ii=1 µi |J efek tetap komponen varians kelompok dengan kelompok, yaitu : τ 2 = I P (µi − µ)2 / (I − 1) i=1 nilai ini pada pokoknya adalah varians µi bila masing-masing µi diperlakukan sebagai pengukuran tunggal. Dengan demikian variabilitas yang terkait dengan nilai Forced Mid-expitory Flow (FEF) untuk seseorang dalam salah satu kelompok mempunyai dua komponen, yaitu : (1) komponen τ 2 untuk variasi antar-kelompok dan (2) komponen σi2 (i = 1, 2, . . . , 5) untuk variasi dalam kelompok. Jika ditentukan data yang lebih rinci lagi, maka sebaiknya diuraikan komponen varians dalam kelompok menjadi bagian-bagian, misalnya satu bagian untuk test yang dilakukan dalam satu hari, dan satu bagian lain untuk perilaku jangka panjang dari sebuah objek. Selanjutnya untuk memperoleh informasi lebih banyak lagi, maka kelompok tersebut masih dapat lagi dibagi, mungkin satu untuk daerah tempat tinggal dan satu untuk kelompok dalam daerah lain. Jika jumlah pengukuran dalam masing-masing kelompok kecil, maka nilai taksiran τ 2 dan σi2 tidak dapat ditentukan dengan jelas, hal ini terjadi jika sampel untuk Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 11 populasi masing-masing kelompok berukuran 1, sehingga tidak dapat dipisahkan nilai dari τ 2 dengan σi2 , demikian juga nilai σi2 tidak bisa ditaksir hanya dari data saja. Apabila ukuran masing-masing kelompok diperbesar, mean sampel untuk kelompok ke-I yi , maka nilai taksiran µi akan lebih dekat, sehingga nilai τ 2 dan σi2 juga lebih baik, dan nilai taksiran σi2 secara terpisah untuk masing-masing kelompok dapat ditentukan dengan taksiran takbias biasa. Taksiran Varians untuk Populasi I Taksiran varians untuk populasi I ditentukan dengan : σ̂i2 = J X j=1 (yij − yi· )2 / (J − 1), yi· = X yij /J j Untuk kemudahan pencekatan lambang d̂iletakkan diatas σ dan bukan di atas σ 2 secara keseluruhan, yang akan dianggap sebagian orang sebagai notasi yang lebih deskriptif dan lebih tepat. 3.3 Teknik Linierisasi Pertimbangan problema NLIP dimana J = J dan anggap fungsi objektif F dan fungsi kendala f adalah polinomial. Teknik linierisasi secara luas digunakan untuk problema-problema seperti ini. Semua dasar untuk masalah non biner, teknik seperti ini terdiri dari dua langkah transformasi. Langkah pertama adalah dengan mengubah formulasi non biner menjadi formulasi biner atau formula 0-1. Dengan kata lain, variabel integer x digantikan oleh biner y. Asumsikan bahwa masingmasing xj memiliki batas atas terhingga yaitu uj , persamaan untuk x dapat ditulis Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 12 sebagai : xj = tj X 2i yij i=0 (3.1) yij = 0, 1, i = 0, . . . , tj dimana tj adalah integer positif terkecil, u ≤ 2tj+1 1 Langkah kedua adalah mereduksi program polinomial 0-1 ke program linier 0-1 dengan memperkenalkan variabel 0-1 yang baru untuk menggantikan bagian-bagian cross product. Dimana bentuk y n (dimana y = 0 atau 1) dapat disederhanakan menjadi y. Ambil Q sebagai variabel himpunan 0-1, kemudian setiap perbedaan hasil Πj∈Qyj dari variabel 0-1 akan digantikan dengan variabel 0-1 yang baru yaitu yQ. Untuk membuktikan yQ = 1 jika dan hanya jika Πj∈Qyj = 1, kita mengambil dua bentuk kendala baru − X yj + yq + q − 1 > 0 (3.2) X yj qyQ ≥ 0 (3.3) yQ = 0 atau 1 (3.4) j∈Q dan j∈Q dimana q jumlah elemen pada Q. Masalah kelinieran dapat disederhanakan dengan menggunakan beberapa anggota standart, seperti algoritma Balas. Bagaimanapun, program linier 0-1 yang baru di formulasikan pada harga yang signifikan. Untuk setiap bagian cross product, sebuah variabel biner harus ditam- Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 13 bahkan dua pembuktian. Dimana harga variabel dan bukti akan naik secara merata untuk program nonlinier 0-1 yang kecil. Hasil Linierisasi Alternatif yang linier 0-1, program polynomial telah diusulkan oleh Glover dan Woolsey (1973,1974), di dalam suatu usaha untuk memperluas cakupan permasalahan nonlinier di mana pendekatan linier yang diubah terbukti efektif. Karena kesukaran memprogram permasalahan bilangan bulat (dan mixed-integer) sering dipertahankan pada banyaknya bilangan bulat variabel, mereka menggantikan polynomial terminologi perkalian oleh kontinu variabel yQ ∈ [0, 1] sebagai ganti 0-1 variabel. Batasannya yj > yq, ∀j ∈ Q ditambahkan untuk membuktikan (3) Bentuk (3.5) menentukan harga 0 sampai yQ dimana yj = 0 untuk semua j ∈ Q, dan dari (3.2), yQ = 1 untuk semua j ∈ Q. Bagaimanapun, dalam kaitan dengan (3.5), banyaknya batasan akan meningkat secara drastis, walaupun variabel yang biner akan tinggal yang sama dalam jumlah. Untuk menyelesaikan masalah ini, diberikan petunjuk lebih lanjut, misalnya memberi masing-masing yQ status suatu variabel kontinu di dalam suatu pertunjukan economical lebih jauh. Misalkan Kj menandakan satuan himpunan berisi yj , dan misalkan nj menandakan banyaknya unsur-unsur di Kj , kemudian batasan format nj yj > X yQ (3.5) Q∈Kj mungkin mengganti persamaan (3.3). Adalah mudah untuk menunjukkan bahwa persamaan (3.6) akan memberi lebih sedikit batasan dibanding persamaan (3.3). Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 14 Glover (1975) mempunyai prosedur diberi lebih lanjut untuk mengurangi banyaknya batasan dan variabel baru yang diperkenalkan untuk mengakomodasi cross product. Ia telah menunjukkan variabel kontinu tunggal wj boleh menggantikan n P satu himpunan kwadrat xi cij xj dimana xi = 0 atau 1, untuk semua i ∈ N = j=1 {1, . . . , n}. Oleh karena itu, batasan D̄i xi > wi > D i xi (3.6) dan X dij xj − Di (1 − xj ) > wi > j X dij xj − D̄i (1 − xi ) (3.7) j dimana Di n X min(dij , 0) j=1 dan D̄ i n X max(dij , 0) j=1 ditentukan bahwa wi jika xi = 0 P dij xj jika xi = 1 dan wi = Ini adalah suatu peningkatan luas bandingkan dengan Teknik Watters, ketika kita dapat mengamati bahwa hanya n variabel kontinu baru dan 4n batasan tambahan akan ditambahkan jika teknik ini telah diberlakukan bagi suatu standard program bilangan bulat kwadrat. Bagaimanapun, lebih kecil, seperti perumusan secara khas menyediakan relaksasi berlanjut agak lemah dan pemusatan adalah lambat (Mcbride dan Yormark, 1980a,b). Fungsi multilinier hanya menyatakan ulang nilai dari fungsi g(x) dalam variabel 0 dan 1. Secara aljabar, fungsi multilinier f (x) dapat ditulis dalam bentuk : g(x) = X at Πj∈Nt xj , xj = 0 atau 1, j ∈ Nt t∈N Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 (3.8) 15 dimana at , t ∈ N adalah bilangan real dan Π adalah symbol perkalia. Oleh karena itu program nonlinier 0 dan 1 melibatkan fungsi dengan bilangan real yang dapat dinyatakan dalam bentuk multilinier yaitu : min {F (x)|fi(x) ≤ 0, i ∈ K, x biner} (3.9) dimana F dan f adalah fungsi multilinier. Linearisasi program multilinier tidak membutuhkan variabel baru (Granot dan Hammer, 1971). Pada awalnya disebut generalized covering problem yang dapat ditulis dalam bentuk berikut: Minimize cT x̄ (3.10) Subject to Ax̄α ≥ 1 (3.11) dan integer 0 ≤ x̄ ≤ 1 (3.12) αj α dimana A adalah matriks 0-1, x̄ = (1x) adalah vector 0-1 dan x̄ = equiv(x̄j ) x̄αj if αj = 1 j sehingga: x̄j = xj if αj = 0 Sebagai alternatif, Granot dan Granot (1980) menggunakan teknik liniearisasi yang sama, tetapi pada setiap tahap algoritma menyelesaikan problema covering linier sehingga relaksasi dari problema tersebut kendala yang memiliki subset yang kecil dari kendala pada problema covering yang sama. Tujuan utama algoritma ini adalah dapat diatur untuk mencegah produksi kendala covering yang berlebihan. Belakangan ini, Balas dan Mazzola (1984a,b) sudah memperkenalkan suatu linierisasi MLP baru bagi suatu padanan yang dihimpun mencakup masalah, gunakanlah hanya variabel yang asli, terutama sekali untuk suatu multilinier untuk Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 16 format g(x) = X i∈N at Y xj 6 b, xj = 0 atau j ∈ Nt (3.13) j∈Nt Mereka menggambarkan suatu famili dari ketidaksamaan linier setara dengan persamaan (3.9) itu berisi linierisasi yang lebih ringkas (atau lebih kecil jumlah mencakup batasan) tentang yang MLP dibanding yang didasarkan pada disamaratakan mencakup ketidaksamaan. Perhitungan mengalami regenerasi secara acak menghasilkan multilinier 0-1 program dengan 20 batasan dan 50 variabel diperkenalkan. Applicabilas ini mendekati ke permasalahan lebih besar dan memerlukan penyelidikan lebih lanjut. Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 BAB 4 PEMBAHASAN 4.1 Varians Varians σ 2 (d∗ ) = E (d∗ − E[d∗ ])2 dapat diperoleh dengan menggunakan nilai 2 asimptot dari E(d∗ ), dihitung deret taylor dari (d∗ − E[d∗ ]) dalam (w/n − SE (d)). Kemudian diambil nilai ekspektasi dengan mengganti (w/n−SE (d))k dengan momen pusat diperoleh (wikipedia, 2008): σ 2 (d∗ ) = µ2 0 SE (d)2 n SE ”(d) − SE ”(d)µ22 4 + µ3 SE0 (d)2 SE0 (d)6 n2 +O 1 n3 Estimator yang paling efektif, diantara semua estimator yang mungkin adalah yang mempunyai nilai varians yang minimum, variansnya adalah sebagai berikut: 2 σ 2 (d∗ ) = F n(d) + O n12 dimana F (d) = S 0 µ(d) 2 . Dengan menghitung nilai ekspekE tasi tentunya meminimumkan F (d) dan akan memberikan nilai asimptot (dalam n) estimator yang optimal. Ada beberapa pilihan untuk meminimumkan, dapat menurunkan E terbaik untuk: a. Jarak yang diberikan d, contohnya min F (d) Eij b. Sebuah norm untuk range jarak untuk d = 0 sampai 200, contoh dengan R 200 min 0 F (t)dt Eij c. Memaksimalkan range jarak, untuk d = 0 sampai 200, contoh min max F (d). Eij d=0...200 17 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 18 Hasil estimasi OLS sering disebut dengan istilah BLUE (Best Linier Unbiased Estimator). Sederhananya, hasil estimasi yang bersifat BLUE adalah (Gujarati, 2003): 1. Efisien, artinya hasil nilai estimasi memiliki varians yang minimum dan tidak bias. 2. Tidak bias, artinya hasil nilai estimasi sesuai dengan nilai parameter. 3. Konsisten, artinya jika ukuran sampel ditambah tanpa batas maka hasil nilai estimasi akan mendekati parameter populasi yang sebenarnya. Dalam statistik, estimator merupakan fungsi sampel data yang dapat diobservasi dan digunakan untuk mengestimasi parameter populasi yang tidak diketahui. Estimasi merupakan hasil dari aplikasi fungsi untuk sampel data. Banyak estimator yang berbeda yang mungkin yang menghasilkan parameter. Beberapa kriteria digunakan untuk memilih diantara estimator, meskipun sering kriteria tidak dapat digunakan untuk satu estimator terhadap estimator yang lain. Untuk mengestimasi parameter, prosedur yang biasa digunakan adalah sebagai berikut (wikipedia, 2008): a. Memilih sampel acak populasi b. Menghitung titik estimasi parameter c. Menghitung ukuran keragaman, sering digunakan interval kepercayaan d. Mengasosiasikan ukuran estimasi dari keragaman Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 19 4.2 Data Survei Ruwet dengan Linearisasi Taylor Terdapat sejumlah ketentuan dari asimptot yang ekivalen terhadap penurunan penaksiran deret Taylor dari varians untuk statistik yang ruwet. Binder dan Patak (1994) memberi landasan teori untuk metode yang diturunkan. Bagaimanapun, banyak metode yang dapat diturunkan untuk contoh praktis menggunakan teknik straightforward. Berikut ini merupakan contoh sederhana pendekatan menggunakan estimator ratio dari populasi total : ŶR = R̂X, untuk R̂ = Ŷ /X̂, dan Ŷ = P (4.1) wk yk , dimana S merupakan himpunan yang meng- k∈S indikasikan kecocokan pada unit sampel dan wk merupakan bobot pengambilan, jika P dinormalkan, maka wk merupakan estimator populasi total (Binder, 1996). Contoh wk = 1/πk dimana πk merupakan probabilitas pada order pertama, dan didefinisikan bahwa X̂ analogi ke Ŷ . Pada pers (4.1) jika kedua ruas diturunkan, diperoleh: dŶR = (dR̂)X, (4.2) dimana (dR̂) = (dŶ ) Ŷ (dX̂) X̂ X̂ 2 i 1 h (dŶ ) − R̂(dX̂ ) = X̂ − (4.3) Catatan bahwa pers (4.2) tidak memasukkan turunan total dari X. Populasi total dari variabel X, karena X diasumsikan tetap dan diketahui. Langkah selanjutnya, mengganti semua turunan total dari jumlah yang diestimasi dengan penyimpangan dari nilai ekspektasinya. Disisi sebelah kanan, disubP situsi untuk (dŶ ), ekspresi ( wk yk − Y ), dan lainnya. Untuk jumlah ŶR , diganti Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 20 dŶR dengan ŶR Y . Dari pers (3.2) dibentuk kembali langkahnya, menghasilkan: ŶR − Y = X hX X̂ wk yk − Y − R̂ X wk xk − X i (4.4) Dilihat bahwa ekspresi ini terdiri dari sejumlah bobot estimator, secara eksplisit P P wk xk ), dimana wk s adamenunjukkan keterikatannya pada wk0 s, ( wk yk dan lah implisit dalam ekspresi X̂ dan R̂ . Untuk langkah terakhir, diisolasikan zk , didefinisikan dengan menulis kembali pers (4.4) sebagai: ŶR − Y = X wk zk + bentuk lain yang tergantung secara eksplisit pada wk Disini diperoleh, zk = catatan bahwa P X X̂ (yk − R̂xk ) (4.5) wk zk mempunyai bentuk estimasi populasi total dari variabel z. Sekarang, untuk memperoleh varians ŶR , dimasukkan variabel baru z kedalam k sampel, dan menggunakan prosedur standard untuk mengestimasi varians total diaplikasikan untuk variabel ini. Diasumsikan bahwa varians estimator dengan propertis yang baik cocok untuk pola sampel. Ringkasan umum metode adalah sebagai berikut: a. Andaikan T menjadi T̂ dan mengambil turunan totalnya. b. Ganti turunan total dari T̂ , dT̂ , dengan T̂ T , ganti semua turunan total dari jumlah yang diestimasi dengan penyimpangan dari nilai ekspektasinya, dengan P mensubsitusi (dŶ ), ekspresi ( wk yk − Y ), dan lainnya. Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 21 c. Langkah terakhir mengisolasi zk , kemudian menulis kembali hasil langkah b P sebagai: ŶR − Y = wk zk + bentuk lain yang tergantung secara eksplisit pada wk d. Akhirnya, untuk memperoleh estimasi varians dari T̂ , dimasukkan variabel baru zk ke dalam tiap-tiap sampel, dan menggunakan prosedur standard untuk estimasi total varians, diaplikasikan untuk variabel ini. 4.2.1 Kasus Umum Yang Paling Sederhana Untuk sampel satu fase merupakan kasus umum yang paling sederhana, dimana estimator dapat diekspresikan sebagai fungsi turunan dari total estimasi untuk variabel survey tertentu, beberapa yang boleh diturunkan variabel pada unit level penarikan akhir. Dalam masalah ini, pendekatan yang diberikan adalah: T̂ = g(Ŷ1 , ..., Ŷm) " # X ∂g(Ŷ ) (dŶi ) (dT̂ ) = ∂ Ŷi " # X ∂g(Ŷ ) X ( wk yik − Yi ) T̂ − T = ∂ Ŷi i k X = wk zk + ... #0 " # " X ∂g(Ŷ ) ∂g(Ŷ ) dimana zk = yik = yk ∂ Ŷ ∂ Ŷ i i (4.6) (4.7) (4.8) (4.9) Metode ini berbeda dengan metode Taylor standard. Perbedaan utama adalah bagaimana pers (4.8) diajukan. Pada metode standard, turunan parsial dievaluasi pada nilai ekspektasi sebelum zk diturunkan, maka komponen zk tersebut tidak diketahui yang merupakan estimator yang disubsitusikan. Untuk estimator ratio, Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 22 pers (4.1) akan menghasilkan X/X̂ tak terlihat dari zk pada pers (4.5) karena nilai ekspektasi dari X/X̂ adalah tunggal. Ekspresi R̂ digunakan untuk mengestimasi R yang dibutuhkan dalam turunan zk . Kott (1990) mengargumentasikan bahwa varians estimator untuk ratio yang diturunkan mempunyai kondisi propertis yang baik dibandingkan dengan estimator yang diluar faktor X/X̂. Rao (1995) menunjukkan bahwa metode ini setuju dengan yang diperoleh dari linearisasi Jackknife. Konjuktor ini merupakan turunan parsial pada pers (4.8) yang dievaluasi pada Ŷ dari Y , linearisasi dekat dengan statistik yang asli T̂ . Sehingga menghasilkan varians yang baik. Catatan bahwa pers (4.9) untuk zk , semua bentuk secara langsung mengobservasi sampel, sehingga tidak ada subsitusi estimator untuk jumlah yang tidak diketahui. 4.2.2 Kasus dengan Parameter Tambahan Untuk banyak contoh, estimator paling mudah didefinisikan dalam bentuk yang memasukkan penggunaan yang hanya digunakan untuk menyederhanakan definisi parameter. Untuk estimator ratio, R̂ merupakan contoh untuk parameter tambahan. Pada kasus ini, persamaan eksplisit untuk estimator dari parameter tambahan memungkinkan. Metode umum dalam kehadiran parameter tambahan dapat dituliskan sebagai: T̂ = g1 Ŷ1 , . . . , Ŷm , λ̂ , di mana λ̂ = g2 Ŷ1 , . . . , Ŷm , Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 (4.10) 23 Dimana X ∂g1 Ŷ , λ̂ dŶi = ∂ Ŷi X ∂g1 Ŷ , λ̂ dλ̂j + ∂ λ̂j (4.11) X ∂g2j Ŷ dŶi , dλ̂j = ∂ Ŷi i T̂ − T = ∂g Ŷ , λ̂ X 1 + = Dimana dT̂ ! X wk yik − Yi ∂ Ŷi k X ∂g1 Ŷ , λ̂ X ∂g2j Ŷ X X ∂ λ̂i i (4.12) ∂ Ŷi wk yik − Yi ! k wk zk + . . . , 0 0 ∂g1 Ŷ , λ̂ ∂g1 Ŷ , λ̂ ∂g2 Ŷ yk + yk zk = ∂ Ŷ ∂ Ŷ ∂ λ̂ (4.13) (4.14) untuk kasus dimana parameter tambahan di definisikan hanya secara implisit melalui persamaan estimasi, maka generalisasinya adalah: T̂ = g Ŷ1 , . . . , Ŷm , λ̂ Dimana Û Ŷ1 , . . . , Ŷm , λ̂ = 0 0 X ∂g1 Ŷ , λ̂ X ∂g1 Ŷ , λ̂ dT̂ = dλ̂ dŶi + ∂ Ŷi ∂ λ̂ Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 (4.15) (4.16) (4.17) 24 dimana pengambilan turunan total dari pers (4.16) dan mengisolasikan (dλ̂), diperoleh: −1 ∂ Û Ŷ , λ̂ X ∂ Û Ŷ , λ̂ dŶi dλ̂ = − ∂ λ̂ ∂ Ŷi T̂ − T = wk yik − Yi ∂ Ŷi k # ! 0 " X ∂ Û X ∂ Û ∂g ∂ λ̂ = X ∂g Dimana zk = ! X ∂g X − ∂ Ŷ ∂ λ̂ i ∂ Ŷi wk yik − Yi yk − ∂g ∂ λ̂ 0 " ! k wk zk + . . . , 0 (4.18) (4.19) ∂ Û ∂ λ̂ #0 " ∂ Û ∂ Ŷ #0 yk (4.20) terlihat bahwa pers (4.20) merupakan generalisasi dari bentuk sebelumnya untuk zk yang diberikan pada pers (4.9) dan (4.14). Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 BAB 5 KESIMPULAN Untuk estimator parameter-parameter model yang didefinisikan sebagai penyelesaian untuk persamaan penaksiran berbobot kalibrasi (Generalalized Regression Estimator,disingkat GREG), penulis mengkaji taksiran total varians, dengan mengasumsikan bahwa karakteristik yk pada populasi berhingga dihasilkan dari model superpopulasi. Dengan menggunakan pendekatan Demnati dan Rao (2004) diperoleh estimator varians linierisasi. Estimator varians yang diajukan secara otomatis menjaga ”bobot-g”. Estimator ini juga tetap sah dengan misspesifikasi variansi model yk , dengan mengasumsikan bahwa model kovarians yk dan yt sama dengan 0 untuk k 6= t. 25 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 DAFTAR PUSTAKA Balas, E. and Mazzola, J. B. (1984a), ”Nonlinear 0-1 Programming : Linearization Techniques, and II Dominance Relations and Algorithm”, Math.Progr. 30:1-21. Balas, E. and Mazzola, J. B. (1984b), ”Nonlinear 0-1 Programming : Linearization Techniques, and II Dominance Relations and Algorithm”, Math.Progr. 30:22-45. Binder, D.A. and Patak, Z. (1994). ”Use of estimating functions for interval estimation from complex surveys”, Journal of the American Statist/ca/Assoc/affon, 89, 1035-1043. Binder, D. A. (1996), ”Taylor Linearization For Single Phase And Two Phase Samples:A Cookbook Approach”, R.H. Coats Building, 11-”A”, Ottawa, Ontario, Canada, K1A 0T6, pp. 132-137. Demnati, A. and Rao, J. N. K. (2001),? Linearization Variance Estimators for Survey Data, Methodology Data Branch Working Paper, SSMD-2001-010E, Statistics Canada. Demnati, A. and Rao, J. N. K. (2002), ”Linearization Variance Estimators for Survey Data”, SSC Annual Meeting, Proceedings of the Survey Methods Section, pp. 8792. Demnati, A. and Rao, J. N. K. (2002), ”Linearization Variance Estimators for Survey Data With Missing Responses”, Proceeding of the Section Survey Research Methods, American Statistical Association, pp. 736-740. Demnati, A. and Rao, J. N. K. (2003), ”Linearization Variance Estimators for Longitudinal Survey Data”, Survey Methodology, pp. 138-143. Demnati, A. and Rao, J. N. K. (2004), ”Linearization Variance Estimators for Survey Data (with discussion)”, Survey Methodology, 30, pp. 17-34. Demnati, A. and Rao, J. N. K. (2005), ”Linearization Variance Estimators for Model Parameters From Survey Complex Data”, Proceedings of Statistics Canada Symposium 2005 Methodological Challenges for Future Information Needs, Catalogue no. 11-522-XIE. Glover, F. (1975), ”Improved Linear Integer Programming Formulations of Nonlinear Integer Problems. Management Sci. 22: 455-460. Glover, F. and Woolsey, E. (1973), ”Further Reduction of Zero-One Polynomial Programming Problems to A Zero-One Linear Programming Problems”, Operations Reseacrh 21: 56-160. Glover, F. and Woolsey, E. (1974), ”Converting the 0-1 Polynomial Programming Problem to a 0-1 Linear Programming”, Management Sci. 22: 180-182. Granot, D. and Granot, F. (1980), ”Generalized Covering Relaxation for 0-1 Programs”, Operations research 28: 1442-1449. 26 Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008 27 Granot, F. and Hammer, P. L. (1971), ”On the Use of Boolean Functions in 0-1 Programming”, Methods for Operations Research 12: 154-184. Gujarati, D., 2003, ”Ekonometrika Dasar”, Alih bahasa: Sumarno Zain, Erlangga, Jakarta. Kott, P.S. (1990), ”Estimating the conditional variance of a design consistent regression estimator”, Journal of Statistical Planning and Inference, volume 24, pp. 287-296. Mcbride, R. D. and Yormark, J. S. (1980a), ”An Implicit Algorithm for Quadratic Integer Programming”, Management Sci. 26: 282-296. Mcbride, R. D. and Yormark, J. S. (1980b), ”An Implicit Algorithm for Quadratic Integer Programming”. Management Sci. 26: 784-795. Molina, E. A., Smith, T. M. F. and Sugden, R. A. (2001), ”Modeling Overdispersion for Complex Survey Data”, International Statistical Review, 69, pp. 373-384. Rao, J.N.K. (1995). Private communication. Royall, R. M., and Cumberland, W. G. (1981), ”An Empirical Study of the Ratio Estimator and Estimators of its Variance”, Journal of the American Statistical Association, 76, pp. 66-77. Särndal, C.-E., Swensson, B., and Wretman, J.H. (1989), ”The Weighted Residual Technique for Estimating the Variance of the General Regression Estimator of the Finite Population Total”, Biometrika, 76, pp. 527-537. Valliant, R. (1993), ”Postsratification and Conditional Variance Estimation”, Journal of the American Statistical Association, 88, pp. 89-96. Wikipedia (2008), ”Estimators and Variance of Estimators” http://www.google.com. Dapot Situngkir : Metode Linierisasi Estimator Varians Untuk Model Parameter Data Survei Ruwet, 2009 USU Repository © 2008