pemilihan model regresi linier multilevel terbaik

advertisement
Forum Statistika dan Komputasi, Oktober 2009 p : 1-7
ISSN : 0853-8115
Vol 14 No.2
PEMILIHAN MODEL REGRESI LINIER MULTILEVEL TERBAIK
(Choice the Best Linear Regression Multilevel Models)
Bertho Tantular1, Aunuddin2, Hari Wijayanto2
1
2
Jurusan Statistika FMIPA Universitas Padjadjaran
Departemen Statistika FMIPA Institut Pertanian Bogor
1
E-mail : [email protected]
Abstract
Linear regression models is used to describe relationship between dependent
variable and independent variables. In a survey research, data was used often
have hierarchical structure or nested structure. In this research, independent
variables can be defined at any level of the hierarchy but dependent variable can
only be defined at the lowest level of the hierarchy. Multilevel regression models
is one of the methods can be used to analyze this data. Some authors purpose
many models can be used to analyze data with hierarchical structures. Deviance
as -2 log likelihood was defined as the measure goodness of fit. The difference of
the deviance for two nested models was a method for comparing that two models.
Keywords : Hierarchy Data, Multilevel Models, Maximum Likelihood, Deviance
PENDAHULUAN
Penelitian sosial seringkali terkonsentrasi pada
masalah bagaimana menelusuri hubungan antara
individu dengan lingkungannya. Konsep umum
suatu individu berkorelasi dengan komunitas
sosialnya adalah bahwa suatu individu dipengaruhi
lingkungan sosial tempat mereka berada, dan sifatsifat dari lingkungan sosial tersebut terbentuk oleh
individu-individu yang membuat lingkungan
tersebut. Secara umum individu dan lingkungan
sosial merupakan suatu sistem hierarki atau dapat
dikatakan sebagai suatu struktur tersarang (nested).
Penelitian data yang berstruktur hierarki peubahpeubah dapat didefinisikan pada tingkat individu
dan pada tingkat lingkungan. (Hox 2002)
Beberapa peneliti telah membuat beberapa
pendekatan untuk menganalisis data berstruktur
hierarki. Ringdal (1992) menyebutkan bahwa pada
awalnya analisis digunakan tanpa memperhatikan
informasi mengenai keanggotaan individu dalam
lingkungan meskipun data yang diperoleh berisi
informasi tersebut. Hal ini mengakibatkan
ketidakpuasan pada hasil analisisnya karena tidak
bisa didapatkan simpulan yang lebih khusus untuk
masing-masing lingkungan. Selain itu secara teori,
mengabaikan informasi ini dapat menimbulkan
masalah dalam inferensinya.
Jones & Steenbergen (1997) menyebutkan
bahwa masalah yang muncul akibat mengabaikan
informasi
lingkungan
adalah
munculnya
heteroskedastisitas dalam galat. Pendekatan lain
untuk menganalisis data berstruktur hierarki adalah
dengan cara membuat model-model yang terpisah
untuk setiap taraf pada tingkat lingkungan.
Pendekatan ini menimbulkan masalah yaitu banyak
informasi mengenai lingkungan menjadi tidak
tercakup. Masalah lain yang muncul dari
pendekatan ini adalah bahwa interaksi antar faktor
dari tingkat yang berbeda tidak bisa didapatkan.
Pendekatan lain yang lebih baik adalah dengan
menggunakan model regresi peubah boneka. Model
regresi dengan peubah boneka dapat digunakan
untuk mengatasi masalah heterogenitas. Akan tetapi
model regresi dengan peubah boneka tetap tidak
dapat mengatasi apabila ada hubungan antara
peubah pada tingkat yang berbeda.
Model multilevel mulai diperkenalkan oleh
Goldstein (1995). Model ini disebutkan dapat
mengatasi semua masalah yang muncul dari data
dengan struktur hierarki. Dalam model multilevel,
struktur hierarki didefinisikan sebagai level.
Tingkat yang paling rendah yaitu individu disebut
level 1 dan tingkat yang lebih tinggi yaitu
lingkungan disebut level 2. Model multilevel selain
dapat menentukan keragaman antar lingkungan juga
dapat menunjukkan korelasi antar dua individu
yang pada model lain diasumsikan tidak ada. Selain
itu model multilevel juga dapat mengukur interaksi
yang mungkin terjadi antara peubah pada tingkat
yang berbeda.
Penelitian ini bertujuan menentukan faktorfaktor yang memengaruhi respon pada model
regresi linier multilevel dengan memperhitungkan
keragaman data yang disebabkan oleh adanya
pengaruh acak kelompok. Selain itu juga akan
dijelaskan cara menentukan model regresi linier
terbaik untuk data berstruktur hierarki atau data
1
Pemilihan Model Regresi Linier Multilevel Terbaik
(Choice the Best Linear Regression Multilevel Models)
multilevel dan menjelaskan adanya keragaman yang
dapat memengaruhi respon pada setiap level dalam
model tersebut
METODOLOGI PENELITIAN
Data Penelitian
Data yang digunakan adalah data mengenai nilai
ujian pertama dan nilai ujian akhir seemester
mahasiswa pascasarjana Institut Pertanian Bogor
mata kuliah Analisis Statistika (STK511) pada
tahun ajaran 2008/2009. Data tersebut terdiri atas 5
kelas dimana masing-masing kelas terdiri atas
beberapa program studi. Mahasiswa-mahasiswa
yang mengambil mata kuliah STK511 berada dalam
program studi-program studi tersebut. Setiap
mahasiswa dicatat nilai ujian pertama dan ujian
akhir semester. Dari data tersebut ingin diketahui
apakah nilai ujian pertama mempengaruhi nilai
ujian akhir dan bagaimana model yang tepat untuk
mengambarkan hubungan itu.
Peubah yang digunakan untuk penelitian ini
adalah nilai ujian akhir digunakan sebagai peubah
respon dan nilai ujian pertama sebagai peubah
penjelasnya. Semua peubah yang digunakan diukur
pada level pertama.
Metode Penelitian
Struktur data yang digunakan adalah mahasiswa
merupakan satuan pengamatan pada level 1,
program studi level 2 dan kelas adalah level 3.
Untuk keperluan analisis penelitian ini ditentukan
notasi sebagai berikut :
i = 1, 2, 3, ..., njk menyatakan mahasiswa dalam
program studi j kelas k
j = 1, 2, 3, ..., mk menyatakan program studi
dalam kelas k
k = 1, 2, 3, 4, 5 menyatakan kelas.
Notasi tersebut digunakan dalam tahapan analisis
sebagai berikut :
1. Membuat pemodelan regresi linier biasa
yijk = β0 + β1Xijk + εijk
Penduga kemungkinan maksimum digunakan
untuk model ini (Myers, 1994). Model regresi
digunakan untuk melihat pola sebaran data
secara gabungan.
2. Menggambarkan struktur tersarang pada level 3
melalui grafik untuk masing-masing kelas dan
struktur tersarang pada level 2 juga melalui
grafik.
3. Melakukan pengujian terhadap adanya struktur
tersarang dari level 3 dan level 2 dengan
menggunakan perbedaan deviance (Jones dan
Steinbergen, 1997)
diff = D1 – D2
(1 )
dengan D1 adalah deviance pada model
komponen ragam 3-level dan D2 adalah
deviance pada model komponen ragam 2-level
Forum Statistika dan Komputasi
4. Membangun pemodelan multilevel intersep acak
dengan memperhatikan pengaruh kelas dan
pengaruh program studi
yijk = β0jk + β1jkXijk + εijk (Model level 1)
β0jk = γ00k + u0jk (Model untuk level 2)
γ00k = δ000 + v0k (Model untuk level 3)
Model ini digunakan untuk menentukan ada
tidaknya perbedaan intersep dari setiap
kelas/program studi. Penduga kemungkinan
maksimum dan galat bakunya
(2)
(3)
dengan V adalah matriks blok diagonal
parameter acak. Penduga (2) dan (3) diperoleh
melalui proses iterasi. (Hox 2002)
5. Membangun pemodelan multilevel koefisien
acak
yijk = β0jk + β1jkXijk + εijk (Model level 1)
β0jk = γ00k + u0jk (Model untuk level 2)
β1jk = γ10k + u1jk
γ00k = δ000 + v0k (Model untuk level 3)
γ10k = δ100 + v1k
Model ini digunakan untuk menentukan ada
tidaknya perbedaan kemiringan (slope) dari
setiap kelas/program studi. Penduganya adalah
Persamaan (2).
6. Membandingkan model-model tersebut dengan
menggunakan pengujian perbedaan deviance
pada Persamaan (1) untuk diperoleh model
terbaiknya.
7. Menentukan keragaman yang dapat dijelaskan
pada setiap level menggunakan persamaan
berikut (Bliese 2006, Kramer 2005) yaitu :
(4)
dengan
penduga ragam residu pada level 1
dengan p peubah penjelas dan
penduga
ragam residu pada level 1 tanpa peubah
penjelas,
(5)
dengan
penduga ragam residu pada level 2
dengan p peubah penjelas dan
penduga
ragam residu pada level 2 tanpa peubah penjelas.
HASIL DAN PEMBAHASAN
Deskripsi Data Nilai Ujian
Data nilai ujian STK511 terdiri atas 447
mahasiswa yang tersarang didalam 36 program
studi. Program studi-program studi tersebut
tersarang didalam 6 kelas. Dari setiap mahasiswa
tersebut diukur nilai ujian pertama dan nilai ujian
2
Pemilihan Model Regresi Linier Multilevel Terbaik
(Choice the Best Linear Regression Multilevel Models)
akhir. Kemudian ingin diketahui apakah ada
pengaruh ujian pertama terhadap ujian akhir.
Perbedaan karakter mahasiswa antar program studi
tentu akan ada pengaruhnya terhadap pola belajar
mahasiswa dalam program studi tersebut.
Perbedaan dosen pengajar mata kuliah STK511
pada setiap kelas diduga akan memberikan
pengaruh terhadap hasil penilaian nilai ujian
meskipun telah ditetapkan standar dalam penilaian.
Oleh sebab itu keragaman antar program studi yang
ada di dalam kelas dan keragaman antar kelas harus
diperhitungkan dalam model yang akan dibangun.
Pemodelan Data Nilai Ujian
Model regresi dalam hal ini digunakan sebagai
model dasar. Model ini menjadi pembanding bagi
model-model lain. Berikut adalah hasil pendugaan
parameter dengan metode kuadrat terkecil dan plot
grafik analisis regresi yang diperoleh menggunakan
software R adalah sebagai berikut
Tabel 1. Hasil Pendugaan Parameter Model Regresi
untuk Data Nilai Ujian
Dugaan Galat Baku
Intersep
t
Nilai-p
34.6047
3.03589
11.09
0.000
Ujian Pertama 0.45643
0.04244
10.75
0.000
Berdasarkan Tabel 1 jelas terlihat bahwa nilai
ujian pertama berpengaruh sangat nyata terhadap
nilai ujian akhir pada taraf 5%. Nilai koefisien
determinasi (R2) adalah 0.3084 yang artinya Nilai
Ujian Akhir hanya sebesar 20.59% dapat dijelaskan
oleh peubah Nilai Ujian Pertama, sisanya dijelaskan
oleh peubah lain.
Forum Statistika dan Komputasi
mengikuti pola garis regresinya tetapi mempunyai
keragaman yang cukup besar.
Penjelasan Struktur Tersarang Model Multilevel
Untuk Level 3 data nilai ujian dapat dideskripsikan
dengan cara membuat plot grafik analisis regresi
dari masing-masing kelas. Dari plot ini dapat dilihat
keragaman pola regresi antar kelas.
Gambar 2. Plot Regresi untuk Masing-masing
Kelas
Dari Gambar 2 terlihat pola dari setiap kelas
memiliki kemiripan, kecuali untuk Kelas A. Pola
sebaran data pada plot untuk Kelas A terlihat
cenderung berkumpul di bagian kanan atas yang
berarti mayoritas mahasiswa Kelas A memiliki nilai
ujian yang tinggi. Dari kemiripan pola ini
menimbulkan dugaan bahwa kelas tidak
mempunyai pengaruh yang nyata terhadap Nilai
Ujian Akhir. Hal ini akan dibuktikan dengan
menggunakan prosedur berikut ini.
Analisis data menggunakan model multilevel
diawali dengan membuat model tanpa melibatkan
peubah penjelas. Model ini disebut sebagai model
komponen ragam (Variance Component Model).
Model ini digunakan untuk melihat ada tidaknya
pengaruh dari struktur multilevel (tersarang) dari
data tersebut, selain itu dapat ditentukan pula
besarnya proporsi keragaman dalam level yang
lebih tinggi (West 2007).
Tabel 2 memperlihatkan nilai komponen ragam
untuk masing-masing level pada data nilai ujian.
Pada Tabel 2 terlihat bahwa nilai ragam pada level
3 cukup kecil dibandingkan dengan nilai ragam
level 2 dan level 1. Hal ini mengindikasikan bahwa
tidak adanya keragaman dalam kelas atau dapat
juga dikatakan antara kelas cenderung homogen.
Tabel 2. Nilai Dugaan Parameter Acak Model TigaLevel tanpa Peubah Penjelas
Parameter
Gambar 1. Plot Analisis Regresi Data Nilai
Ujian
Pada Gambar 1 tampak data menyebar secara
merata mengikuti pola garis regresinya. Dari
gambaran tersebut terlihat bahwa data meskipun
Dugaan
σ2v0
(level 3)
36.49518
σ2u0
(level 2)
95.35708
2
(level 1)
327.48897
σ
e0
3
Pemilihan Model Regresi Linier Multilevel Terbaik
(Choice the Best Linear Regression Multilevel Models)
Berdasarkan nilai dugaan parameter tersebut dapat
diperoleh nilai koefisien korelasi intra class sebagai
berikut :
Nilai ini mengandung arti bahwa proporsi ragam
pada level program studi sebesar 28,7 % dan
proporsi ragam pada level kelas sebesar 7,95 %.
Selain itu dapat dijelaskan pula bahwa korelasi
antara dua mahasiswa dalam satu program studi
sebesar 0.287. sedangkan dalam kelas sebesar
0.0795. Memperhatikan nilai ini bahwa korelasi
dalam kelas cukup kecil tetapi perlu diuji
keberadaan keragaman dalam kelas.
Selanjutnya dibangun model 2 level tanpa
peubah penjelas. Model ini digunakan untuk
melihat apakah dengan dikeluarkannya struktur
kelas dari model tidak memengaruhi keragaman
pada level program studi dan tidak memengaruhi
koefisien korelasi intra-class untuk level 2. Tabel
berikut dapat menjelaskan hal tersebut
Tabel 3. Nilai Dugaan Parameter Acak Model DuaLevel tanpa Peubah Penjelas
Parameter
σ
2
σ
u0
2
e0
Dugaan
(level 2)
128.5939
(level 1)
326.6247
Dari tabel 3 jelas sekali terlihat bahwa nilai
ragam pada program studi menjadi lebih besar
setelah struktur kelas telah dikeluarkan dalam
model bila dibandingkan nilai ragam pada Tabel 2.
Hasil perbandingan deviance dapat dilihat pada
Tabel 4. Berdasarkan Tabel 4 terlihat bahwa
perbedaan model 3-level dengan model 2-level
tidak nyata pada taraf 5% artinya bahwa tidak
terdapat perbedaan yang nyata antara model 2-level
dengan model 3-level. Hal ini menunjukkan bahwa
keragaman dalam kelas tidak berpengaruh terhadap
nilai ujian akhir.
Tabel 4. Nilai Deviance untuk Model 3-level dan
Model 2-level Data Nilai Ujian
Model
Deviance Parameter Diff
3-level
3908.37
4
2-level
3909.60
3
1.23
db
1
Nilai-p
0.27
Keragaman Level 2 dapat dideskripsikan secara
visual menggunakan pola gambar plot regresi dari
setiap program studi. Plot regresi ditampilkan untuk
masing-masing program studi di dalam kelas. Pada
Gambar 3 terlihat terlihat bahwa plot regresi Kelas
Forum Statistika dan Komputasi
A ada tiga program studi yaitu IPN, SVK dan THH
memiliki pola yang hampir sama, sementara
program studi KVT dan MEJ memiliki pola yang
sama sekali berbeda dengan yang lainnya.
Keragaman pada pola plot regresi dari 8 program
studi di dalam kelas B. Empat program studi
memiliki pola yang hampir sama yaitu PPN, SPD,
MAT dan IPH. Tiga program studi lainnya
memiliki pola yang mirip yaitu KMP, MAN dan
GMS. Sementara program studi APL memiliki pola
yang sama sekali berbeda dengan yang lainnya.
Untuk Kelas C plot regresi Pola plot regresi Enam
program studi memiliki pola yang hampir sama
yaitu SPT, IPH, TPT, ITP, IFO dan BRP.
Sementara program studi MKM dan INP memiliki
pola yang sama sekali berbeda dengan yang lainnya.
Hal yang sama terlihat pada Kelas D untuk program
studi TIP dan STK mempunyai pola yang hampir
sama, sementara program studi TPP dan ATT
memiliki pola yang berbeda dengan yang lainnya.
Sementara untuk Kelas E perbedaan plot regresi
terlihat pada program studi BIK dan BIO seperti
terlihat pada Gambar 3 dan program studi FIT pada
kelas F berbeda dengan yang lainnya. Beberapa
perbedaan pola garis regresi juga disebabkan oleh
sedikitnya jumlah data dalam suatu program studi
seperti pada program studi IFO, IPH, MKM dan
PS5 yang datanya kurang dari 5 buah.
Secara umum dari Gambar 3 plot regresi untuk
masing-masing program studi terlihat adanya
perbedaan pola. Hal ini mengindikasikan adanya
pengaruh program studi terhadap nilai ujian akhir
STK511.
Model Intersep Acak
Dalam model ini ingin diketahui adanya
pengaruh acak dari program studi. Hasil dugaan
parameter untuk model ini dapat dilihat pada tabel
berikut.
Tabel 5. Hasil pendugaan parameter model intersep
acak untuk Data Nilai Ujian
Dugaan Galat Baku db
Intersep
t
Nilai-p
31.080
3.228
410 9.629
0
ujian pertama 0.5058
0.037
410 13.66
0
Dilihat dari tabel diatas jelas terlihat bahwa nilai
ujian pertama berpengaruh nyata terhadap nilai
ujian akhir pada taraf 5%.
Model Koefisien Acak
Dalam model koefisien acak peubah Nilai ujian
pertama dipengaruhi oleh keragaman dalam
program studi. Hasil dugaan parameter untuk model
koefisien acak dapat dilihat pada tabel 6. Dilihat
dari tabel 6 jelas terlihat bahwa nilai ujian pertama
berpengaruh sangat nyata terhadap nilai ujian akhir
pada taraf 5%.
4
Pemilihan Model Regresi Linier Multilevel Terbaik
(Choice the Best Linear Regression Multilevel Models)
Forum Statistika dan Komputasi
Gambar 3 Plot Regresi Masing-masing Program Studi dalam Kelas
Tabel 6. Hasil Pendugaan Parameter Model
Koefisien Acak untuk Data Nilai Ujian
Dugaan Galat Baku db
Intersep
t
Nilai-p
31.2694
4.7408
410 0.06
0
Ujian Pertama 0.5012
0.0571
410 8.78
0
Pemilihan Model Terbaik
Seperti pada contoh data yang pertama, untuk
membandingkan model-model untuk data ini
digunakan
nilai
deviance.
Tabel
berikut
menjelaskan perbedaan deviance untuk ketiga
model.
Tabel 7. Nilai Deviance untuk Setiap Model Nilai
Ujian untuk Data Nilai Ujian
Model
Deviance Parameter
Diff
db Nilai-p
Regresi
3914.98
3
Intersep acak
3760.34
4
154.64 1 0.00000
Koefisien acak 3743.15
6
17.19
dibandingkan dengan model intersep acak.
Sehingga dapat disimpulkan bahwa model koefisien
acak merupakan model yang terbaik untuk
permasalahan ini.
Hasil pengujian pada Tabel 7 juga memberikan
arti bahwa keragaman yang ada pada kemiringan
(slope) berarti sehingga dapat disimpulkan bahwa
program studi memberikan pengaruh nyata terhadap
nilai ujian akhir.
Persamaan yang dapat dibentuk untuk
menggambarkan permasalahan ini adalah sebagai
berikut
yijk = β0jk + β1jkXijk + εijk (Level 1)
β0jk = 31.2694 + u0jk
(Level 2)
β1jk = 0.5012 + u1jk
atau dalam bentuk model campuran (West, 2006)
adalah substitusi Level 2 ke Level 1 yaitu
yijk = 31.2694 + 0.5012Xijk + {u1jkXijk + u0jk +εijk }
2 0.00002
Dari Tabel 7 terlihat bahwa Model koefisien
acak mempunyai nilai deviance yang paling kecil.
Hal ini menyiratkan bahwa model koefisien acak
merupakan model yang lebih baik dari model
lainnya. Hasil pengujian memperkuat simpulan ini,
berdasarkan pengujian Model Regresi jauh lebih
buruk dibandingkan dengan model intersep acak,
sedangkan model koefisien acak yang lebih baik
Dari model tersebut dapat dijelaskan bahwa apabila
nilai ujian pertama meningkat satu satuan maka
nilai ujian akhir akan meningkat sebesar 0.5012
satuan, tetapi peningkatan ini juga dipengaruhi oleh
keragaman antar program studi.
Tabel 8 menjelaskan nilai dugaan komponen
ragam galat untuk model koefisien acak. Dari Tabel
8 terlihat bahwa pengaruh acak pada koefisien nilai
ujian pertama memperbesar ragam pada intersep
yang berarti bahwa nilai ujian pertama
5
Pemilihan Model Regresi Linier Multilevel Terbaik
(Choice the Best Linear Regression Multilevel Models)
menyebabkan keragaman antar program studi
menjadi semakin jelas.
Tabel 8. Nilai Dugaan Komponen Ragam Model
Koefisien Acak untuk Data Nilai Ujian
Komponen
Intersep Level 2 (u0)
Ragam
492.590
Forum Statistika dan Komputasi
adanya perbedaan pada program studi pendidikan
S1 yang ditempuh mahasiswa.
Selain itu, perbedaan universitas tempat
mahasiswa menempuh program studi S1 juga
berperan dalam keragaman ini karena universitas
yang berbeda tentu mempunyai tingkat kompetensi
yang berbeda-beda pula terhadap mata kuliah
Statistika yang pernah diperolehnya.
Nilai ujian pertama Level 2 (u1) 0.05689
Residual (e0)
204.4506
Keragaman yang Dapat Dijelaskan Pada Setiap
Level
Keragaman pada setiap level yang dapat
dijelaskan oleh model dapat diperoleh dari
perbandingan model dengan melibatkan peubah
penjelas dan model tanpa melibatkan peubah
penjelas. (Kramer, 2005)
Untuk memperoleh nilai keragaman yang dapat
dijelaskan pada setiap level untuk data ini
digunakan model tanpa peubah penjelas level 1
sebagai dasar dan model intersep acak. Dalam data
ini tidak digunakan model koefisien acak yang
merupakan model terbaik pada bagian sebelumnya
karena model koefisien acak berfungsi sebagai
model dasar bagi keragaman yang ada pada slope
pada setiap level dan tidak dapat digunakan untuk
menjelaskan keragaman yang ada pada intersep.
Tabel 9. Nilai Dugaan Komponen Ragam Model
Intersep Acak untuk Data Nilai Ujian
Komponen
Ragam
Intersep Level 2 (u0)
122.9820
Residual (e0)
226.8315
Nilai ragam ini akan lebih berarti apabila dapat
dicari nilai keragaman yang dapat dijelaskan pada
setiap level. Untuk level 1 dan level 2 dapat
digunakan Persamaan 4 dan Persamaan 5. Nilai
keragaman ini dapat diperoleh menggunakan
dugaan pada Tabel 3 dan Tabel 9 yaitu sebagai
berikut:
Dari hasil tersebut terlihat bahwa keragaman
yang dapat dijelaskan oleh model pada level 1
sebesar 30,55 % dan keragaman yang dapat
dijelaskan oleh model pada level 2 sebesar 4,34 %.
Hal ini mengandung arti bahwa keragaman program
studi memberikan kontribusi terhadap nilai ujian
akhir sebesar 3,43% dan sebesar 30,55% kontribusi
diberikan oleh nilai ujian pertama. Keragaman antar
program studi secara umum dapat disebabkan oleh
SIMPULAN
Model multilevel dapat digunakan untuk data
dengan struktur hierarki yaitu data dengan struktur
tersarang. Model multilevel dapat mengatasi
masalah-masalah yang muncul dari data berstruktur
hierarki yaitu masalah heterogenitas, masalah
hubungan antara peubah pada level yang berbeda
dan masalah terdapatnya komponen acak dalam
model. Selain daripada itu model multilevel juga
dapat mengukur keragaman dari setiap level.
Struktur data nilai ujian STK511 memiliki 3
level hierarki, mahasiswa tersarang dalam program
studi dan program studi tersarang dalam kelas.
Dapat disimpulkan bahwa struktur kelas tidak
memiliki pengaruh terhadap respon. Hal ini
dijelaskan oleh hasil pengujian, sehingga model
yang digunakan hingga level kedua. Hasil ini
menunjukkan bahwa perbedaan dosen pengajar
mata kuliah STK511 tidak memengaruhi nilai ujian.
Model koefisien acak merupakan model yang
paling cocok untuk menggambarkan pengaruh nilai
ujian pertama terhadap nilai ujian akhir dengan
memperhitungkan adanya keragaman antar program
studi. Hasil yang diperoleh adalah program studi
yang berbeda akan memberikan pengaruh yang
berbeda dalam peningkatan nilai ujian akhir selain
pengaruh yang diberikan oleh peningkatan nilai
ujian pertama.
Keragaman nilai ujian akhir dapat dijelaskan
oleh keragaman nilai ujian pertama dan keragaman
antar program studi. Hal ini menunjukkan adanya
pengaruh program studi terhadap nilai ujian akhir.
Keragaman antar program studi secara umum dapat
disebabkan oleh adanya perbedaan pada program
studi pendidikan S1 yang ditempuh mahasiswa.
Selain itu, perbedaan universitas tempat mahasiswa
menempuh program studi S1 juga berperan dalam
keragaman ini karena universitas yang berbeda
tentu mempunyai tingkat kompetensi yang berbedabeda pula terhadap mata kuliah Statistika yang
pernah diperolehnya.
DAFTAR PUSTAKA
Bliese P. 2006. Multilevel Models in R (2.2). R
Development Core Team.
Goldstein H. 1995. Multilevel Statistical Models 2nd
Ed. London. Arnold London.
Hox JJ. 2002. Multilevel Analysis: Techniques and
Applications. New Jersey. Lawrence Erlbaum
Associates Publishers.
6
Pemilihan Model Regresi Linier Multilevel Terbaik
(Choice the Best Linear Regression Multilevel Models)
Jones BS & Steenbergen MR. 1997. Modelling
Multilevel Data Structures. Paper prepared in
14th annual meeting of the political methodology
society. Columbus. OH.
Kramer M. 2005. R2 Statistics for Mixed Models.
Published Paper in Biometrical Consulting
Service, ARS (Beltsville, MD), USDA.
Myers RH. 1990. Classical and Modern
Regression with Applications. Boston : PWSKENT Publishing Company.
Forum Statistika dan Komputasi
Ringdal K. 1992. Methods for Multilevel Analysis.
Acta Sosiologica 35:235-243.
West BT, Welch KB, Galechi AT. 2006. Linear
Mixed Models: A Practical Guide Using
Statistical Software. Boca Raton : Chapman &
Hall.
7
Download