BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Dalam dunia pendidikan saat ini, salah satu komponen penting yang dibutuhkan dalam pembelajaran adalah penilaian. Penilaian merupakan proses pengukuran kemampuan peserta didik dalam suatu mata ajaran. Teori uji klasik dan teori uji modern telah dikenal dalam pengukuran pendidikan. Pada pengukuran klasik, kelompok butir yang sama diisi oleh kelompok peserta yang sama. Jika kelompok butir soal atau kuisioner yang sama ditempuh atau diisi oleh kelompok peserta yang berbeda, maka ciri atau karakteristik kelompok butir itu pada umumnya berubah. Dengan kata lain, taraf sukar dan daya beda kelompok butir itu berubah semata-mata karena mereka ditanggapi oleh kelompok peserta yang berbeda. Untuk butir yang sama, kelompok peserta berbeda menunjukkan ciri butir (taraf sukar dan daya beda) yang berbeda. Hal ini menjadi kelemahan pada pengukuran klasik. (Azwar, 1999) Guna menutup kelemahan teori tes klasik tersebut, dikembangkanlah teori tes modern. Tujuan utama teori tes modern adalah melepaskan ketergantungan antara butir tes dengan peserta tes. Dalam teori tes modern, karakteristik butir akan tetap sama (invarian) tidak bergantung pada peserta tes yang mengisi. Demikian pula, karakteristik peserta tes juga akan tetap, tidak bergantung pada butir tes yang mereka isi. Salah satu jenis teori tes modern adalah teori respon butir (item respon theory), yang selanjutnya disebut dengan IRT. Pada teori responsi butir (IRT), kita mengenal tiga hal. Hal pertama adalah proporsi jawaban benar yang dilakukan oleh peserta tes terhadap butir soal. Hal kedua yaitu ciri butir yang menyebabkan para peserta memberikan respon seperti itu. Hal ketiga yaitu ciri terpendam (latent trait) peserta yang menyebabkan para peserta tes memberikan respon seperti itu. Menurut Prasetyono (2009) ada dua masalah utama pada teori responsi butir. Pertama adalah bagaimana menentukan persamaan responsi butir atau persamaan karakteristik butir itu. Hal ini dikenal sebagai penentuan model 1 2 responsi butir atau model karakteristik butir. Kedua adalah bagaimana menentukan nilai parameter butir dan nilai parameter peserta. Hal ini dikenal sebagai pengestimasian parameter, baik parameter butir maupun parameter peserta. Jika masalah pertama dapat diselesaikan dengan pemilihan persamaan responsi butir yang memiliki alasan yang kuat agar dapat diterima sebagai model responsi butir yang akan digunakan, serta masalah kedua dapat diselesaikan dengan butir yang banyak dan direspon oleh banyak peserta maka bagaimana jika respon dari banyak peserta tes tersebut merupakan data tersarang dalam tingkatantingkatan yang saling berhubungan. Menurut (Fox, 2013) sebagian besar data penelitian pendidikan memiliki karakter bertingkat. Biasanya, level pengamatan terendah berada pada siswa di level kedua, kemudian siswa tersarang pada kelas di level ketiga, kemudian kelas tersarang pada sekolah di level keempat, dan sebagainya. Struktur multilevel menyiratkan berbagai tingkat analisis untuk memperhitungkan perbedaan antara pengamatan, antara siswa, dan antara tingkat unit yang lebih tinggi lainnya. Kedepannya, analisis linear tidak dimungkinkan karena dependensi antara pengamatan disetiap kelompok, karena pengelompokan mengarah pada pelanggaran asumsi umum pengamatan yang didistribusikan secara independen. Ketika data tersarang tersebut diabaikan, maka yang terjadi adalah agregasi bias ( yaitu kesimpulan tingkat kelompok yang salah diasumsikan untuk diterapkan ke seluruh anggota kelompok), hal ini dikenal juga sebagai kesalahan ekologis, dimana hal ini sangat mungkin terjadi. Selain itu, perkiraan ketepatan pengukuran juga sering bias. Berdasarkan masalah diatas, akan dilakukan pemodelan multilevel untuk IRT, dimana model multilevel merupakan salah satu bagian dari model statistika yang mengajarkan bagaimana menganalisis data dengan struktur hirarki dimana pada level 1 yang diukur adalah peubah respon dan beberapa peubah prediktor diukur pada setiap level. Pemodelan Multilevel merupakan pendekatan statistika yang dapat digunakan untuk menangani data tersarang atau berkelompok. Salah satu keuntungan dari pendekatan pemodelan multilevel yaitu model dapat menangani data di mana subjek yang akan diukur bervariasi. 3 1.2 Tujuan dan Manfaat Berdasarkan hal-hal yang disebutkan diatas, tujuan dari penelitian adalah untuk mengetahui bentuk model multilevel untuk IRT. Sedangkan manfaat dari penelitian ini diharapkan mampu memberikan informasi tambahan untuk dunia pendidikan terutama dalam proses penilaian, Selain itu diharapkan agar penelitian ini dapat dikembangkan untuk memperoleh hasil yang sesuai dengan apa yang dibutuhkan dunia pendidikan indonesia saat ini. 1.3 Tinjauan Pustaka Literatur utama yang menjadi acuan dalam penelitian ini adalah artikel yang ditulis oleh Pastor (2003) dan Ravand (2015). Jurnal ini membahas tentang model multilevel untuk teori responsi butir (IRT) serta terapannya. Selain menggunakan jurnal, penelitian ini juga menggunakan beberapa buku sebagai acuan. Buku-buku yang digunakan antara lain buku berjudul Dasar-Dasar Psikometri yang ditulis oleh Azwar (1999), “Fundamental of Item Response Theory” karya Hambleton, dkk (1991), dan Teori Responsi Butir karya Sudaryono (2013) yang merupakan rujukan dalam definisi, asumsi-asumsi, komponen dasar, dan model-model logistik dari teori responsi butir. Definisi dan konsep-konsep dasar dari model statistik multilevel diperoleh dari rujukan berupa buku teks. Beberapa buku yang digunakan yaitu “Multilevel Statistical Model” yang ditulis oleh Goldstein (2010), Pengantar Statistika Edisi ke-3 yang ditulis oleh Walpole (1997), “Applied Multilevel Analysis” yang ditulis oleh Hox (1995), dan “Introduction to Probability and Mathematical” yang ditulis oleh Bain dan Engelhardt (1991). 1.4 Metodologi Penelitian Metode yang digunakan untuk penelitian ini adalah dengan studi literatur, dimana dengan menggunakan berbagai referensi pendukung berupa buku teks dan jurnal untuk memperoleh pengetahuan yang baik tentang model multilevel untuk teori responsi butir. Langkah pertama yang dilakukan adalah mempelajari konsep- 4 konsep dasar dari teori respon butir seperti definisi IRT, karakteristik butir, dan model-model logistik. Setelah itu, yang dilakukan adalah mengulang kembali/ mempelajari kembali konsep-konsep dasar dari teori ruang contoh dan peluang, peluang bersyarat, dan variabel random. Setelah itu, yang dilakukan adalah mempelajari konsep-konsep dasar model statistik multilevel seperti model regresi linear 2 level dan model regresi logistik 2 level. Setelah konsep-konsep dasar dari teori responsi butir serta model statistik multilevel dipahami, selanjutnya dipelajari tentang model multilevel untuk teori responsi butir dan terapannya yang nantinya akan dilanjutkan dengan studi kasus dengan data yang diperoleh dari lapangan. 1.5 Sistematika Penulisan Penelitian ini terdiri atas lima bab. Berikut akan dijelaskan setiap bab beserta isi didalam bab tersebut. Bab I merupakan pendahuluan, yang berisi latar belakang dan permasalahan, tujuan dan manfaat penelitian, tinjauan pustaka, metodologi penelitian, dan sistematika penulisan. Pada Bab II dibahas tentang definisi-definisi dan konsep dasar dari teori responsi butir dan model statistik multilevel. Selanjutnya pada Bab III dibahas model multilevel untuk teori responsi butir. Pada Bab IV dibahas studi kasus penerapan model multilevel untuk teori respon butir pada jawaban peserta tes bidang studi matematika SMA Katolik Villanova, Manokwari, Papua Barat, untuk mengetahui besar kemampuan siswa, besar taraf kesukaran butir soal, serta bagaimana efek random siswa pada level 2 dan efek random kelas pada level 3. Bab V merupakan penutup dalam penelitian ini, yang berisi kesimpulan dari keseluruhan pembahasan penelitian ini serta saran tentang hal-hal yang dapat dikaji lebih jauh mengenai topik dalam penelitian ini.