penilaian-otentik

advertisement
1
Bahan Pelatihan Penilaian Otentik
Konferensi HEPI di Denpasar 14 September 2014
_________________________________________________
PENILAIAN OTENTIK
Djemari Mardapi *)
*) Dosen Universitas Negeri Yogyakarta
Anggota HEPI
1
2
A. Pengertian
Pendidikan merupakan unsur penting dalam meningkatkan kesejahteraan masyarakat.
Melalui pendidikan akan dihasilkan sumber daya manusia yang andal dalam mengelola
sumber daya alam dan dalam memberi layanan. Bahkan menurut Nelson Mandela
“Education is the most powerful weapon which you can use to change the world.”. Hal ini
menunjukkan betapa pentingnya pendidikan dalam mengubah masyarakat dari yang kurang
sejahtera menjadi sejahtera, dari masyarakat yang kurang teratur menjadi teratur.. Oleh
karena itu semua Negara berusaha meningkatkan kualitas pendidikan..
Kualitas pendidikan dapat dilihat pada kompetensi lulusan
lembaga
pendidikan,
termasuk sekolah-sekolah. Peningkatan kualitas pendidikan berarti peningkatan kompetensi
lulusan, yaitu kompetensi sumber daya manusia. Untuk mengetahui kompetensi sumber daya
manusia perlu dilakukan penilaian. Penilaian merupakan hal yang esensi untuk mengetahui
kompetensi yang dimiliki peserta didik, sebagai hasil pembelajaran. Melalui penilaian akan
diketahui keberhasilan suatu program peningkatan kualitas sumber daya manusia.
Pembelajaran pada dasarnya adalah kegiatan melakukan perubahan pada peserta didik
yang hasilnya harus diketahui. Untuk mengetahui besar dan kualitas perubahan dilakukan
penilaian. Hasil penilaian berupa informasi yang diperlukan oleh pendidik,
dan orang tua untuk mengetahui keberhasilan proses pembelajaran.
peserta didik,
Jadi penilaian
merupakan hal yang penting dalam meningkatkan kualiats pembelajaran.
Ada empat kegiatan
yang sering digunakan berkaitan dengan
pengukuran, pengujian, penilaian, dan evaluasi. Pertama adalah
penilaian yaitu
pengukuran, yaitu
penetapan angka terhadap suatu objek atau gejala dengan cara yang sistematik (Allen &
Yen, 1979). Akurasi penetapan angka ini ditentukan oleh kualitas instrumen dan cara
menggunakan instrumen ini, yang kemungkinan memiliki kesalahan pengukuran (Johnson
& Johnson: 2, 2003). Kesalahan pengukuran ini bisa disebabkan oleh alat ukur, objek yang
diukur, subjek yang mengukur, dan lingkungan pengukuran. Kesalahan ini ada yang bersifat
acak dan ada yang sistematik.Kesalahan yang bersifat acak ini dapat diestimasi dengan
menggunakan beberapa asumsi, sedang kesalahan yang sistematik sulit diestimasi besarnya,
hanya arahnya yang kemungkinan dapat diduga.
Kedua adalah pengujian, yaitu kegiatan untuk mengetahui pencapaian belajar atau
kompetensi yang dicapai peserta didik. Pengujian dilakukan dengan menggunakan tes yang
2
3
terdiri atas sejumlah pertanyaan yang memiliki jawaban benar atau salah. Banyak bentuk tes
yang dapat digunakan,untuk pengujian masing-masing memiliki kelebihan dan keterbatasan.
Ketiga adalah penilaian, yaitu kegiatan mengumpulkan informasi tentang kualitas atau
kuantitas perubahan pada peserta didik.
Penilaian juga diartikan sebagai
kegiatan
menafsirkan data hasil pengukuran, misalnya tinggi, rendah, baik, buruk, indah, jelek, dan
sebagainya. Penilaian berfokus pada individu sedang evaluasi berfokus pada kelompok atau
kelas. Penilaian dapat dilakukan saat
proses pembelajaran berlangsung, dan ketika
suatu
program pembelajaran selesai.
Ke keempat adalah evaluasi, yaitu
suatu program, termasuk
suatu kegiatan untuk menentukan keberhasilan
program pembelajaran. Tujuan evaluasi adalah
untuk
meningkatkan kualitas, kinerja, atau produktivitas suatu lembaga dalam melaksanakan
programnya. Kagiatan evaluasi sering menggunakan judgment terhadap hasil suatu penilaian.
Bila hasilnya bagus terus dan bila tidak baik berhenti, atau diperbaiki Melalui evaluasi akan
diperoleh informasi tentang apa yang telah dicapai dan mana yang belum, dan selanjutnya
informasi ini digunakan untuk perbaikan suatu program. Menurut Tyler (1950), evaluasi
adalah proses penentuan sejauh mana tujuan pendidikan telah tercapai. Evaluasi menurut
Griffin & Nix (1991) adalah judgment terhadap nilai hasil pengukuran atau implikasi dari
hasil pengukuran. Tyler menekankan pada pencapaian tujuan suatu program, sedang Griffin
& Nix lebih menekankan pada penggunaan hasil penilaian.
B. Penilaian
Kegiatan penilaian dan evaluasi memerlukan data hasil pengukuran. Alat ukur yang
digunakan untuk mengumpulkan data bisa berupa tes dan nontes. Tes yang baik harus
mewakili domain yang diukur dan mengukur tingkat berfikir yang tepat. Domain yang
diukur ini adalah bahan ajar yang dapat dilihat pada silabus mata pelajaran. Informasi yang
akurat berasal dari sejumlah pengukuran, yaitu yang dilaksanakan sepanjang semester.
Bentuknya bisa berupa tugas, ulangan mingguan, dan ulangan pertengahan dan ulangan akhir
semester. Dengan demikian pencapaian belajar peserta didik pada suatu bidang studi dapat
diketahui.
Alat ukur yang digunakan harus diusahakan agar memberikan data yang sahih (valid)
dan
andal
(reliable). Sahih berkaitan
dengan
sampel bahan ajar yang diujikan
mewakili isi kurikulum. Sampel bahan ajar digunakan dalam menyusun kisi-kisi instrumen
3
4
tes karena waktu untuk ujian singkat, sedang
bahan ajar pada kurikulum cukup banyak.
Sampel bahan ajar yang dipilih adalah yang esensi, memiliki nilai aplikasi, dan sering
digunakan. Andal berkaitan dengan kesalahan pengukuran, yang
dinyatakan dengan
koefisien keandalan. Semakin tinggi koefisien keandalan akan semakin rendah kesalahan
pengukuran Batas minimum koefiesn keandalan yang diteirma adalah 0,70. Namun ada yang
mensyuaratkanlebih tinggi dari 0,70, tergantung pada resiko hasil pengukuran.
Penilaian hasil pembelajaran harus mencakup ranah kognitif, afektif, dan psikomotorik.
Sesuai dengan karakteristiknya teknik penilaian untuk ketiga ranah tersebut tidak sama.
Untuk ranah kognitif bisa dilakukan dengan tes tertulis, ranah psikomotor dengan tes
perbuatan, dan ranah afektif melalui pengamatan, inventori, atau kuesioner. Hasil penilaian
ketiga ranah tersebut akan memberikan informasi tentang kompetensi
peserta didik.
Informasi ini diperlukan untuk merancang program perbaikan atau remedi.
Penilaian memerlukan instrumen tes atau nontes untuk memperoleh informasi yang
diperlukan. . Peserta didik dalam menjawab pertanyaan suatu intrumen tes melibatkan proses
berpikir atau prilaku mental. Proses berpikir yang terlibat dalam menjawab pertanyaan
dalam tes bertingkat, yaitu memahami, penyelesaian masalah, berpikir kritis, dan kreatif.
Prilaku mental yang diprlukan dalam menjawab pertanyaan dapat dilihat pada kata kerja
yang digunakan pada isntrumen tes.
digunakan dalam mengembangkan
Klasifikasi prilaku mental dan kata kerja yang
instrumen
tes
disajikan pada Tabel 1. Tabel 1
Tabel 1. Tipe Kemampuan Mental dan Kata Kerja yang digunakan dalam Tes
Prilaku Mental
Kata kerja kunci
Pemahaman
Definisikan, deskripsikan, beri contoh, tunjukkan,
dan
ceritakan
Penyelesaian masalah
Jawablah, hitunglah, simpukan, tentukan, selesaikan
Berpikir kritis
Analisis, bandingkan, beri kritik, hipotesiskan, evaluasi,
prediksi, judge
Kreatifitas
Bangun suatu konstruk, rancang, tamplikan, buatlah,
tuliskan,
4
5
Tabel 2. Bentuk penilaian, deksripsi, dan manfaatnya
Penilaian
Wawancara
Cerita atau tes
bercerita
Contoh tulisan
Projek/pameran
Deskripsi
Manfaat
Guru menanyakan peserta didik Informal dan kontek luwes
tentang bacaan, minat
Dilakukan untuk semua peserta
didik
Mencatat jawaban wawancara
Peserta didik menceritakan ide Peserta
didik
menghasilkan
utama suatu teks ysng dibaca laporan lisan yang dapat diskor
atau yang didengar
dengan menggunakan rubrik atau
rating
Peserta
didik
menghasilkan Peserta
didik
menghasilkan
makalah dalam bentuk narasi
dokumen tertulis yang
dapat diskor isi dan kalimatnya
dengan menggunakan rubrik
Peserta
didik
melakukan
Peserta didiik megerjakan suatu presentasi formal, laporan tertulis
projek individual atau kelompok Dapat mengamati produk tulisan
atau lisan, dan
ketrampilan
berpikir
Peserta didik melakukan
Eksperimen/demon eksperimen atau
mendemonstrasikan material
strasi
yang digunakan
Peserta didik ,membuat
presentasi lisan, laporan tertulis,
atau keduanya.
Dapat diskor dengan rubric atau
skala rating
Peserta didik memberi respons Peserta
didik
menghasilkan
laporan tertulis, diskor dengan
Response
yang tertulis
rubrik atau skala rating
dikonstruksi
Items
Guru mengamati atensi peserta Pengaturan ruang kelas
Pengamatan guru didik, respons terhadap bahan Merekam hasil pengamatan
ajar, atau interaksi dengan catatan anekdot, atau skala rating
peserta didik lain
Portfolio
Fokus pada koleksi karya peserta Mengintegrasikan informasi dari
didik
untuk
menunjukkan berbagai sumber
kemajuannya antar waktu
Memberikan gambaran lengkap
tentang unjuk kerja peserta didik
Peserta didik terlibat banyak dan
dapat
melakukan
penilaian
sendiri
5
6
menunjukkan ada 4 (empat) klasifikasi prilaku mental, dan tiap klasifikasi disertai dengan
kata kerja yang digunakan dalam menyusun tes. (Haladyna, 1997: 32).
Bentuk penilaian dapat dikategorikan menjadi dua, yaitu bentuk pilihan dan bentuk
uraian. Pada bentuk pilihan dalam menjawab pertanyaan peserta didik berpikir kemudian
menentukan pilihan jawaban. Pada tes bentuk ini, tidak diketahui proses berpikir peserta
didik dalam memilih jawaban, bahkan peserta didik yang tidak berpikir atau tidak membaca
soal dapat menjawab pertanyaan Tes bentuk ini cocok untuk tes skala luas, seperti ujian
nasional, tes seleksi masuk ke perguruan tinggi.
Pada tes bentuk uraian peserta didik diminta untuk menuiliskan jawaban dalam bentuk
kalimat atau penyelesaian soal, sehingga dapatdiketahui proses berpikir atau penalaran
peserta didik dalam menjawab soal ujian. Dengan menelusuri jawaban peserta didik akan
diketahui penalaan atau proses berpikir peserta didik dalam menjawab pertanyaan. .
Beberapa bentuk penilaian, deksripsi dan manfaat disajikan pada Tabel 2. Tabel 2
menunjukkan bahwa ada sejumlah bentuk penilaian yang dapat dikategorikan sebagai
penilaian unjuk kerja dan penilaian otentik. Setiap bentuk penilaian memiliki cara pemberian
skor yang tepat, seperti karya tulis peserta didik bisa diskor dengan menggunakan rubrik
atau dengan skala rating 1 sampai 5 misalnya..
C. Penilaian Otentik
Penilaian otentik adalah kegiatan untuk mengetahui pengetahuan dan atau ketrampilan
peserta didik melalui pertanyaan pada level berpikir aplikasi atau lebih tinggi yang menuntut
jawaban secara tertulis atau lisan. Penilaian otentik dilaksanakan secara kontinu dalam
kontek lingkungan belajar atau dunianyata yang bermakna yang merefleksikan pengalaman
belajar sesungguhnya. Informasi ini diperoleh
melalui observasi, portfolio, eksprimen,
anekdot, jurnal, contoh pekerjaan dalam konteks dunia nyata. Melalui penilaian otentik akan
diperoleh informasi kemampuan peserta didik yang sebenarnya, karena
tidak ada unsur
tebakan dalam menjawab pertanyaan. Peserta didik dituntut untuk menggunakan konsep atau
keterampilan dalam kontek dunia nyata. Bentuk penilaian ini dapat digunakan pada proses
pembelajaran di kelas. Hal ini sesuai dengan tuntutan penggunaan sistem penilaian terpadu
pada kurikulum 2013.
6
7
Tingkat berpikir yang digunakan pada penilaian otentikpada level aplikasi sampai pada
level kreasi dalam konteks lingkungan sekitarnya. Artinya kontek pertanyaan adalah yang
terdapat di lingkungan. Tujuan penilaian otentik adalah untuk mengetahui kemampuan
peserta didik dalam konteks dunia nyata (real world). Pada penilaian ini peserta didik
belajar bagaimana menerapkan pengetahuan dan keterampilan yang dimiliki pada tugastugas otentik. Bentuk pertanyaan pada soal penilaian otentik di atas level hapalan, yaitu
keterampilan analitik, kemampuan mengintegrasikan apa yang dipelajari; kreativitas;
kemampuan bekerjasama, Penilaian otentik menghargai proses belajar dan hasilnya sebagai
suatu produk. Komparasi penilaian tradisional penilaian otentik disajikan pada Tabel. 3.
Tabel 3. . Komparasi Penilaian Tradisonal dan Otentik
Tradisional
Otentik
Memilih jawaban
Situasi dikarang
Hapalan
Bukti tidak langsung
Menampilkan suatu karya
Kehidupan nyata
Konstruksi/aplikasi
Bukti langsung
Contoh objek penilaian otentik adalah: kegiatan melakukan percobaan bidang sains,
melakukan penelitian bidang sosial, menulis cerita, membaca dan menafsirkannya,
penyelesaian masalah matematika atau sains yang memiliki aplikasi pada dunia nyata. Pada
penilaian bentuk ini peserta didik dituntut tidak hanya sekedar hapal formula tetapi lebih dari
itu yaitu mampu menerapkannya dalam kontek kehidupan sehari-hari. Penilaian ini
mendorong peserta didik untuk belajar lebih luas dan dalam agar mampu menerapkan
pengetahuan dan keterampilannya dalam kehidupan sehari-hari.
Pada model tradisional, guru tidak disarankan mengajarkan tes, karena materi tes
merupakan sampel dari pengetahuan atau ketrampilan yang diajarkan. Kemampuan peserta
didik yang dilihat dari hasil tes belum merupakan gambaran kemampuan keseluruhan yang
dimiliki peserta didik. Jadi guru tidak dianjurkan melaksanakan pembelajaran bedasarkan
tes. .
Pada penilaian otentik, guru didorong untuk mengajarkan tes. Peserta didik perlu
belajar bagaimana menyajikan tugas-tugas yang bermakna,
guru menunjukkan model-
model kinerja yang baik. Jawaban terhadap suatu pertanyaan bisa tidak satu, sehingga akan
7
8
diperoleh informasi originalitas jawaban peserta didk. Dalam hal ini akan berkembang
kemampuan berpikir divergent peserta didik.
Menurut Nitko &Brookhart (2007:253) penilaian otentik memiliki kesamaan dengan
penilaian unjuk kerja atau penilaian kinerja. Pada penilaian kinerja, peserta didik dituntut
menerapkan pengetahuan atau keterampilan yang dimiliki, tetapi belum tentu aplikasi pada
konteks dunia nyata. Peringkat berpikir yang terlibat dalam mengerjakan tugas pada
penilaian unjuk kerja sama dengan pada penilaian otentik, bedanya adalah konteks
pertanyaannya yang berbeda.
Menurut Nitko dan Brookhart (2007:253) penilaian
unjuk kerja kadang-kadang
disebut sebagai penilaian bermakna atau penilaian otentik. Selanjutnya dijelaskan bahwa
menurut perspektif filsafat pendidikan, kata otentik dalam penilaian otentik berarti
menyajikan peserta didik dengan tugas-tugas yang secara langsung bermakna terhadap
pendidikan dan bukan secara tidak langsung. Sebagai contoh, membaca sejumlah kalimat
yang panjang dan menggunakannya untuk membandingkan dan menkontraskan
sudut
pandang sosial yang berbeda secara langsung bermakna, karena -kalimat yang panjang
membuat orang berpikir lebih luas. Sebaliknya penyajian kalimat yang pendek-pendek, dan
peserta didik diminta memilih jawaban, misalnya apa judul karangan tersebut. Contoh ini
menunjukkan bahwa penggunaan kalimat dari potongan cerita, kemudian peserta didik
diminta memilih jawaban, hal ini merupakan penilaian tidak langsung.
Pengembangan penilaian otentik yang baik adalah dimulai dengan mengidentifiksi
standar bagi peserta didik.Standar menjadi acuan dalam melaksanakan pembelajaran dan
dalam melakukan penilaian.Standar yng menjadi acuan adalah standar isi dari kurikulum
yang digunakan.
Pada penilaian otentik peserta didik diberi tugas untuk memecahkan masalah di
lingkungannya. Menurut Wiggin, (1990), tugas otentik memiliki 6 (enam) karakteristik,
sebagai berikut..
1.
Menggunakan pengetahuan untuk mengerjakan tugas yang bermakna.
2.
Menggunakan kombinasi pengetahuan, dan keterampilan.
3.
Menghasilkan
4. Menggunakan
produk yang berkualitas
standard dan kriteria untuk penilaian.
8
9
5. Mendorong peserta didik
menggunakan berbagai cara untuk memecahkan
masalah.
6. Memberi tantangan kepada peserta didik.
Melalui penilaian otentik potensi berpikir peserta didik akan berkembang secara
optimal menjadi kemampuan. Menyusun soal tes untuk penilaian otentik diperlukan
kemampuan berpikir tinggi dan kreatif dalam memilih kondisi yang diperlukan. Untuk itu
gurun harus berlatih dan banyak membaca agar timbul ide-ide baru dalam menyusun tes yang
baik. .
___________________________________________________________________
Daftar Pustaka
Allen, Mary, J., & Yen, Wendy, J (1979). Introduction to measurement theory. California:
Brooks/Cole Publishing Company.
Andersen, L. W., & Krathwohl. (2001). A Taxonomy for learning, teaching and assessment.
Boston: Longman.
Berk, R. A. (1986, Ed). Performance assessment. Baltimore: The John Hopkins University
Press.
Djemari Mardapi. (2012). Pengukuran, penilaian, dan evaluasi pendidikan. Yogyakarta:
Medica Publishing.
Haladyna, Thomas. M. (1997). Writing test items to evaluate higher order thinking. Boston:
Allyn and Bacon
Nitko, J. Anthony., Brookhart, Susan. M. (2007) . Educational assessment of
students.Singapore: Pearson Merril Prentice Hall.
O’malley, J. Michael., Pierce, Valdez. Lorraine (1996) .Authentic assessment for English
language learners. USA. Addition Wesley Publishing Company.
Johnson, D. W., & Johnson, R. T. (2002). Meaningful assessment. Boston:: Allen &
Bacon.
9
Download