Uploaded by muhammadhisyam6799

Validitas

advertisement
Validitas dan Reliabilitas
Pengukuran
Muhammad Zammi, M.Pd
Validitas
•
•
Validitas berasal dari bahasa Latin validus yang berarti
kuat, “strong”, “robust”
Perlu dibedakan dua buah konsep validitas:
1. Validitas penelitian;
2. Validitas pengukuran
Validitas Penelitian
• Validitas penelitian adalah derajat kebenaran kesimpulan
yang ditarik dari sebuah penelitian, baik penelitian yang
bertujuan menguji hipotesis atau mengestimasi kekuatan
hubungan variabel atau efek intervensi, yang dinilai
berdasarkan metode penelitian yang digunakan,
keterwakilan sampel penelitian, dan sifat populasi asal
sampel
Contoh Validitas Penelitian
• Sebuah meta-analisis dari 18 studi menyimpulkan bahwa
penggunaan telepon seluler ≥10 tahun meningkatkan risiko
tumor otak, yakni neuroma akustik dan glioma (Hardell et
al., 2007) merupakan validitas penelitian
• Andaikata sesungguhnya penggunaan telepon seluler ≥10
tahun tidak meningkatkan risiko tumor otak, maka
kesimpulan penelitian tersebut tidak valid (tidak benar)
Validitas Pengukuran
• Validitas pengukuran merupakan pernyataan tentang
derajat kesesuaian hasil pengukuran sebuah alat ukur
(instrumen) atau pengukuran dengan apa yang seharusnya
akan diukur oleh peneliti
• Pengukuran variabel harus benar (valid) agar diperoleh
data yang valid
• Validitas pengukuran menentukan validitas penelitian
Contoh Validitas Pengukuran
• Suatu prosedur diagnostik menentukan bahwa seorang
mengidap penyakit, padahal sesungguhnya orang tersebut
tidak mengalami penyakit tersebut, maka pengukuran
dengan prosedur diagnostik tersebut tidak menunjukkan
validitas pengukuran  disebut False Positive
• Sebaliknya jika seorang yang berpenyakit tidak didiagnosis
sebagai sakit oleh prosedur diagnostik, maka pengukuran
dengan prosedur tersebut tidak menunjukkan validitas
pengukuran  disebut False Negative
Dimensi Validitas Pengukuran
•
•
•
•
Validitas Isi
Validitas Muka
Validitas Konstruk
Validitas Kriteria
Validitas Isi
•
•
Validitas isi (content validity) merujuk kepada derajat
kesesuaian hasil pengukuran variabel yang diteliti oleh
sebuah alat ukur dengan isi (content) dari variabel
tersebut sebagaimana yang dimaksudkan oleh peneliti.
Validitas isi mencakup dua aspek:
1. Relevansi isi (content relevance),
2. Liputan isi (content coverage) (Messick, 1980,
dikutip oleh Streiner dan Norman, 2000).
Relevansi Isi dan Liputan Isi
• Relevansi isi (content relevance) merujuk kepada
kesesuaian antara masing-masing item pengukuran dengan
isi variabel yang diukur.
• Cakupan isi (content coverage) merujuk kepada lingkup
item pengukuran dalam meliput segala aspek isi variabel
yang diukur.
Sebuah tes dikatakan memiliki validitas isi apabila
mengukur tujuan khusus tertentu yang sejajar dengan
materi atau isi pelajaran yang diberikan. Validitas isi
merupakan validitas yang diperhitungkan melalui pengujian
terhadap isi alat ukur dengan analisis rasional. Pertanyaan
yang dicari jawabannya dalam validasi ini adalah “sejauh
mana item-item dalam suatu alat ukur mencakup
keseluruhan kawasan isi objek yang hendak diukur oleh alat
ukur yang bersangkutan?” atau berhubungan dengan
representasi dari keseluruhan kawasan.
Validitas Muka
• Validitas ini menggunakan kriteria yang sangat sederhana,
karena hanya melihat dari sisi muka atau tampang dari
instrumen itu sendiri. Artinya, jika suatu tes secara
sepintas telah dianggap baik untuk mengungkap fenomena
yang akan diukur, maka tes tersebut sudah dapat dikatakan
memenuhi syarat validitas permukaan, sehingga tidak perlu
lagi adanya judgement yang mendalam. .
Validitas Konstruk
•
Validitas konstruk (construct validity) Secara etimologis,
kata kontruksi mengandung arti susunan, kerangka atau
rekaan. Sebuah tes dikatakan memiliki validitas kontruksi
apabila butir- butir soal yang membangun tes tersebut
mengukur setiap aspek berfikir seperti yang disebutkan
dalam Tujuan Instruksional Khusus. Jadi jika butir- butir
soal mengukur aspek berfikir tersebut sudah sesuai
dengan aspek berfikir yang menjadi tujuan instruksional.
Validitas Kriteria/Empiris
•
•
Validitas kriteria (criterion validity) merujuk kepada
kesesuaian antara hasil pengukuran sebuah alat ukur
dengan alat ukur ideal (standar emas), tentang variabel
yang diteliti
Validitas kriteria:
1. Validitas Prediktif/Ramalan
2. Validitas Bandingan (Concurrent Validty)
Validitas Prediktif
• Validitas ramalan/prediktif (predictive validity, prognostic validity)
merujuk kepada kesesuaian antara hasil pengukuran alat ukur
sekarang dan hasil pengukuran standar emas di masa mendatang.
• Apabila dengan validitas tes maka yang dimaksut dengan validitas
ramalan dari suatu tes adalah suatu kondisi yang menunjukkan
seberapa jauhkah sebuah tes telah dapat dengan secara tepat
menunjukkan kemampuannya untuk meramalkan apa yang bakal
terjadi pada masa yang akan datang
• hasil pengukuran standar emas dalam validitas prediktif belum
tersedia saat ini, melainkan baru diketahui beberapa waktu
mendatang
Validitas Bandingan (concurrent validity)
• Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas
bandingan apabila tes tersebut dalam kurun waktu yang sama
dengan secara tepat telah mampu menunjukkan adanya hubungan
yang searah antara tes pertama dengan tes berikutnya.
• Pengujian validitas bandingan, data yang mencerminkan
pengalaman yang diperoleh masa yang lalu dibandingkan dengan
data hasil tes yang diperoleh sekarang ini. Jika hasil tes
mempunyai hubungan searah maka tes yang memiliki karakteristik
seperti itu dapat dikatakan telah memiliki validitas bandingan.
Penilaian Validitas
• Pada umumnya validitas isi, validitas muka, validitas
konstruk dinilai secara subjektif dan kualitatif oleh pakar
(validity by assumption)
• Validitas kriteria/empiris dan pada sebagian kecil kasus
validitas konstruk bisa dinilai secara kuantitatif (dengan
rumus tertentu)
• Validitas Tes
 Essay : Korelasi Product Moment (lihat file Ms Word)
 Pilihan Ganda: Point Biserial (lihat file Ms Word)
• Validitas Non Tes dengan Validitas Pakar
Reliabilitas
•
•
Alat ukur (instrumen) yang baik harus mengukur dengan
benar (valid) dan konsisten (andal, reliabel).
Terdapat dua aspek reliabilitas alat ukur:
1. Konsistensi internal
2. Stabilitas.
Contoh Konsistensi Internal
• Jika sebuah instrumen terdiri dari sejumlah item
pertanyaan (misalnya, kuesioner untuk menilai depresi),
maka skor dari masing-masing item pertanyaan seharusnya
berkorelasi dengan skor semua item
Contoh Stabilitas
• Sebuah alat timbang berulang kali mengukur 5kg ± 0kg dari
bobot bayi, sedang alat timbang lainnya mengukur 5kg ± 4kg
dari bobot bayi yang sama
• Bisa disimpulkan bahwa pengukuran dengan alat timbang
pertama lebih stabil daripada alat timbang kedua.
• Stabilitas bisa dipandang sebagai konsistensi eksternal
Cara Penilaian Konsistensi Internal
•
Konsistensi internal antara lain dapat dinilai dengan
Korelasi item-total
Korelasi item-total (item-total correlation) menilai
konsistensi internal alat ukur dengan mengorelasikan
masing-masing item dan total pengukuran, minus item
yang bersangkutan.
Nilai Batas Korelasi Item-Total
• Prinsipnya, suatu item dapat digunakan dalam alat ukur jika
memiliki korelasi item-total > 0.20.
• Item yang berkorelasi lebih rendah hendaknya disingkirkan,
atau ditulis ulang.
• Tetapi item yang berkorelasi terlalu tinggi (>0.90) perlu
dicermati karena mungkin merupakan akibat dari
redundansi (duplikasi) pengukuran, sehingga salah satu
item perlu disingkirkan.
Cutoff Alpha (α) Cronbach
• Cutoff minimal alpha Cronbach untuk sebuah alat ukur
adalah 0.60.
• Sejumlah penulis menggunakan cutoff 0.70 untuk
mengklasifikasi konsistensi internal sebagai memadai, dan
0.80 sebagai baik (Streiner dan Norman, 2000; Garson,
2008).
Aspek Stabilitas
•
Stabilitas mencakup:
1. Stabilitas ketika digunakan pada waktu berbeda
(test-retest reliability)
2. Stabilitas ketika digunakan seorang pengamat pada
dua kesempatan berbeda (intra-observer
reliability)
3. Stabilitas ketika digunakan pengamat berbeda pada
kesempatan sama dengan kondisi yang identik
(inter-observer reliability)
Nilai Batas Stabilitas
• Pada umumnya para penulis menyarankan agar alat ukur
menunjukkan stabilitas dengan koefisien korelasi (r) >0.50.
• Alat ukur memiliki stabilitas memadai jika koefisien
reliabilitas antar pengukuran >0.5, dan stabilitas tinggi jika
koefisien reliabilitas antar pengukuran ≥ 0.8 (Streiner dan
Norman, 2000; Polgar dan Thomas, 2000).
Interpretasi Nilai Kappa
Menurut Landis dan Koch (1977)
Nilai K
Kekuatan kesepakatan
≤0.40
Buruk
0.41 -
≤0.75
Sedang
0.76 -
1.00
Baik
Interpretasi Nilai Kappa
Menurut Altman (1991)
Nilai K
Kekuatan kesepakatan
≤0.20
Buruk
0.21 -
0.40
Kurang dari sedang
0.41 -
0.60
Sedang
0.61 -
0.80
Baik
0.81 -
1.00
Sangat baik
Terima Kasih
Download