Validitas dan Reliabilitas Pengukuran Muhammad Zammi, M.Pd Validitas • • Validitas berasal dari bahasa Latin validus yang berarti kuat, “strong”, “robust” Perlu dibedakan dua buah konsep validitas: 1. Validitas penelitian; 2. Validitas pengukuran Validitas Penelitian • Validitas penelitian adalah derajat kebenaran kesimpulan yang ditarik dari sebuah penelitian, baik penelitian yang bertujuan menguji hipotesis atau mengestimasi kekuatan hubungan variabel atau efek intervensi, yang dinilai berdasarkan metode penelitian yang digunakan, keterwakilan sampel penelitian, dan sifat populasi asal sampel Contoh Validitas Penelitian • Sebuah meta-analisis dari 18 studi menyimpulkan bahwa penggunaan telepon seluler ≥10 tahun meningkatkan risiko tumor otak, yakni neuroma akustik dan glioma (Hardell et al., 2007) merupakan validitas penelitian • Andaikata sesungguhnya penggunaan telepon seluler ≥10 tahun tidak meningkatkan risiko tumor otak, maka kesimpulan penelitian tersebut tidak valid (tidak benar) Validitas Pengukuran • Validitas pengukuran merupakan pernyataan tentang derajat kesesuaian hasil pengukuran sebuah alat ukur (instrumen) atau pengukuran dengan apa yang seharusnya akan diukur oleh peneliti • Pengukuran variabel harus benar (valid) agar diperoleh data yang valid • Validitas pengukuran menentukan validitas penelitian Contoh Validitas Pengukuran • Suatu prosedur diagnostik menentukan bahwa seorang mengidap penyakit, padahal sesungguhnya orang tersebut tidak mengalami penyakit tersebut, maka pengukuran dengan prosedur diagnostik tersebut tidak menunjukkan validitas pengukuran disebut False Positive • Sebaliknya jika seorang yang berpenyakit tidak didiagnosis sebagai sakit oleh prosedur diagnostik, maka pengukuran dengan prosedur tersebut tidak menunjukkan validitas pengukuran disebut False Negative Dimensi Validitas Pengukuran • • • • Validitas Isi Validitas Muka Validitas Konstruk Validitas Kriteria Validitas Isi • • Validitas isi (content validity) merujuk kepada derajat kesesuaian hasil pengukuran variabel yang diteliti oleh sebuah alat ukur dengan isi (content) dari variabel tersebut sebagaimana yang dimaksudkan oleh peneliti. Validitas isi mencakup dua aspek: 1. Relevansi isi (content relevance), 2. Liputan isi (content coverage) (Messick, 1980, dikutip oleh Streiner dan Norman, 2000). Relevansi Isi dan Liputan Isi • Relevansi isi (content relevance) merujuk kepada kesesuaian antara masing-masing item pengukuran dengan isi variabel yang diukur. • Cakupan isi (content coverage) merujuk kepada lingkup item pengukuran dalam meliput segala aspek isi variabel yang diukur. Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi merupakan validitas yang diperhitungkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah “sejauh mana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?” atau berhubungan dengan representasi dari keseluruhan kawasan. Validitas Muka • Validitas ini menggunakan kriteria yang sangat sederhana, karena hanya melihat dari sisi muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka tes tersebut sudah dapat dikatakan memenuhi syarat validitas permukaan, sehingga tidak perlu lagi adanya judgement yang mendalam. . Validitas Konstruk • Validitas konstruk (construct validity) Secara etimologis, kata kontruksi mengandung arti susunan, kerangka atau rekaan. Sebuah tes dikatakan memiliki validitas kontruksi apabila butir- butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam Tujuan Instruksional Khusus. Jadi jika butir- butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan instruksional. Validitas Kriteria/Empiris • • Validitas kriteria (criterion validity) merujuk kepada kesesuaian antara hasil pengukuran sebuah alat ukur dengan alat ukur ideal (standar emas), tentang variabel yang diteliti Validitas kriteria: 1. Validitas Prediktif/Ramalan 2. Validitas Bandingan (Concurrent Validty) Validitas Prediktif • Validitas ramalan/prediktif (predictive validity, prognostic validity) merujuk kepada kesesuaian antara hasil pengukuran alat ukur sekarang dan hasil pengukuran standar emas di masa mendatang. • Apabila dengan validitas tes maka yang dimaksut dengan validitas ramalan dari suatu tes adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa yang akan datang • hasil pengukuran standar emas dalam validitas prediktif belum tersedia saat ini, melainkan baru diketahui beberapa waktu mendatang Validitas Bandingan (concurrent validity) • Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukkan adanya hubungan yang searah antara tes pertama dengan tes berikutnya. • Pengujian validitas bandingan, data yang mencerminkan pengalaman yang diperoleh masa yang lalu dibandingkan dengan data hasil tes yang diperoleh sekarang ini. Jika hasil tes mempunyai hubungan searah maka tes yang memiliki karakteristik seperti itu dapat dikatakan telah memiliki validitas bandingan. Penilaian Validitas • Pada umumnya validitas isi, validitas muka, validitas konstruk dinilai secara subjektif dan kualitatif oleh pakar (validity by assumption) • Validitas kriteria/empiris dan pada sebagian kecil kasus validitas konstruk bisa dinilai secara kuantitatif (dengan rumus tertentu) • Validitas Tes Essay : Korelasi Product Moment (lihat file Ms Word) Pilihan Ganda: Point Biserial (lihat file Ms Word) • Validitas Non Tes dengan Validitas Pakar Reliabilitas • • Alat ukur (instrumen) yang baik harus mengukur dengan benar (valid) dan konsisten (andal, reliabel). Terdapat dua aspek reliabilitas alat ukur: 1. Konsistensi internal 2. Stabilitas. Contoh Konsistensi Internal • Jika sebuah instrumen terdiri dari sejumlah item pertanyaan (misalnya, kuesioner untuk menilai depresi), maka skor dari masing-masing item pertanyaan seharusnya berkorelasi dengan skor semua item Contoh Stabilitas • Sebuah alat timbang berulang kali mengukur 5kg ± 0kg dari bobot bayi, sedang alat timbang lainnya mengukur 5kg ± 4kg dari bobot bayi yang sama • Bisa disimpulkan bahwa pengukuran dengan alat timbang pertama lebih stabil daripada alat timbang kedua. • Stabilitas bisa dipandang sebagai konsistensi eksternal Cara Penilaian Konsistensi Internal • Konsistensi internal antara lain dapat dinilai dengan Korelasi item-total Korelasi item-total (item-total correlation) menilai konsistensi internal alat ukur dengan mengorelasikan masing-masing item dan total pengukuran, minus item yang bersangkutan. Nilai Batas Korelasi Item-Total • Prinsipnya, suatu item dapat digunakan dalam alat ukur jika memiliki korelasi item-total > 0.20. • Item yang berkorelasi lebih rendah hendaknya disingkirkan, atau ditulis ulang. • Tetapi item yang berkorelasi terlalu tinggi (>0.90) perlu dicermati karena mungkin merupakan akibat dari redundansi (duplikasi) pengukuran, sehingga salah satu item perlu disingkirkan. Cutoff Alpha (α) Cronbach • Cutoff minimal alpha Cronbach untuk sebuah alat ukur adalah 0.60. • Sejumlah penulis menggunakan cutoff 0.70 untuk mengklasifikasi konsistensi internal sebagai memadai, dan 0.80 sebagai baik (Streiner dan Norman, 2000; Garson, 2008). Aspek Stabilitas • Stabilitas mencakup: 1. Stabilitas ketika digunakan pada waktu berbeda (test-retest reliability) 2. Stabilitas ketika digunakan seorang pengamat pada dua kesempatan berbeda (intra-observer reliability) 3. Stabilitas ketika digunakan pengamat berbeda pada kesempatan sama dengan kondisi yang identik (inter-observer reliability) Nilai Batas Stabilitas • Pada umumnya para penulis menyarankan agar alat ukur menunjukkan stabilitas dengan koefisien korelasi (r) >0.50. • Alat ukur memiliki stabilitas memadai jika koefisien reliabilitas antar pengukuran >0.5, dan stabilitas tinggi jika koefisien reliabilitas antar pengukuran ≥ 0.8 (Streiner dan Norman, 2000; Polgar dan Thomas, 2000). Interpretasi Nilai Kappa Menurut Landis dan Koch (1977) Nilai K Kekuatan kesepakatan ≤0.40 Buruk 0.41 - ≤0.75 Sedang 0.76 - 1.00 Baik Interpretasi Nilai Kappa Menurut Altman (1991) Nilai K Kekuatan kesepakatan ≤0.20 Buruk 0.21 - 0.40 Kurang dari sedang 0.41 - 0.60 Sedang 0.61 - 0.80 Baik 0.81 - 1.00 Sangat baik Terima Kasih