1 Bahan Pelatihan Penilaian Otentik Konferensi HEPI di Denpasar 14 September 2014 _________________________________________________ PENILAIAN OTENTIK Djemari Mardapi *) *) Dosen Universitas Negeri Yogyakarta Anggota HEPI 1 2 A. Pengertian Pendidikan merupakan unsur penting dalam meningkatkan kesejahteraan masyarakat. Melalui pendidikan akan dihasilkan sumber daya manusia yang andal dalam mengelola sumber daya alam dan dalam memberi layanan. Bahkan menurut Nelson Mandela “Education is the most powerful weapon which you can use to change the world.”. Hal ini menunjukkan betapa pentingnya pendidikan dalam mengubah masyarakat dari yang kurang sejahtera menjadi sejahtera, dari masyarakat yang kurang teratur menjadi teratur.. Oleh karena itu semua Negara berusaha meningkatkan kualitas pendidikan.. Kualitas pendidikan dapat dilihat pada kompetensi lulusan lembaga pendidikan, termasuk sekolah-sekolah. Peningkatan kualitas pendidikan berarti peningkatan kompetensi lulusan, yaitu kompetensi sumber daya manusia. Untuk mengetahui kompetensi sumber daya manusia perlu dilakukan penilaian. Penilaian merupakan hal yang esensi untuk mengetahui kompetensi yang dimiliki peserta didik, sebagai hasil pembelajaran. Melalui penilaian akan diketahui keberhasilan suatu program peningkatan kualitas sumber daya manusia. Pembelajaran pada dasarnya adalah kegiatan melakukan perubahan pada peserta didik yang hasilnya harus diketahui. Untuk mengetahui besar dan kualitas perubahan dilakukan penilaian. Hasil penilaian berupa informasi yang diperlukan oleh pendidik, dan orang tua untuk mengetahui keberhasilan proses pembelajaran. peserta didik, Jadi penilaian merupakan hal yang penting dalam meningkatkan kualiats pembelajaran. Ada empat kegiatan yang sering digunakan berkaitan dengan pengukuran, pengujian, penilaian, dan evaluasi. Pertama adalah penilaian yaitu pengukuran, yaitu penetapan angka terhadap suatu objek atau gejala dengan cara yang sistematik (Allen & Yen, 1979). Akurasi penetapan angka ini ditentukan oleh kualitas instrumen dan cara menggunakan instrumen ini, yang kemungkinan memiliki kesalahan pengukuran (Johnson & Johnson: 2, 2003). Kesalahan pengukuran ini bisa disebabkan oleh alat ukur, objek yang diukur, subjek yang mengukur, dan lingkungan pengukuran. Kesalahan ini ada yang bersifat acak dan ada yang sistematik.Kesalahan yang bersifat acak ini dapat diestimasi dengan menggunakan beberapa asumsi, sedang kesalahan yang sistematik sulit diestimasi besarnya, hanya arahnya yang kemungkinan dapat diduga. Kedua adalah pengujian, yaitu kegiatan untuk mengetahui pencapaian belajar atau kompetensi yang dicapai peserta didik. Pengujian dilakukan dengan menggunakan tes yang 2 3 terdiri atas sejumlah pertanyaan yang memiliki jawaban benar atau salah. Banyak bentuk tes yang dapat digunakan,untuk pengujian masing-masing memiliki kelebihan dan keterbatasan. Ketiga adalah penilaian, yaitu kegiatan mengumpulkan informasi tentang kualitas atau kuantitas perubahan pada peserta didik. Penilaian juga diartikan sebagai kegiatan menafsirkan data hasil pengukuran, misalnya tinggi, rendah, baik, buruk, indah, jelek, dan sebagainya. Penilaian berfokus pada individu sedang evaluasi berfokus pada kelompok atau kelas. Penilaian dapat dilakukan saat proses pembelajaran berlangsung, dan ketika suatu program pembelajaran selesai. Ke keempat adalah evaluasi, yaitu suatu program, termasuk suatu kegiatan untuk menentukan keberhasilan program pembelajaran. Tujuan evaluasi adalah untuk meningkatkan kualitas, kinerja, atau produktivitas suatu lembaga dalam melaksanakan programnya. Kagiatan evaluasi sering menggunakan judgment terhadap hasil suatu penilaian. Bila hasilnya bagus terus dan bila tidak baik berhenti, atau diperbaiki Melalui evaluasi akan diperoleh informasi tentang apa yang telah dicapai dan mana yang belum, dan selanjutnya informasi ini digunakan untuk perbaikan suatu program. Menurut Tyler (1950), evaluasi adalah proses penentuan sejauh mana tujuan pendidikan telah tercapai. Evaluasi menurut Griffin & Nix (1991) adalah judgment terhadap nilai hasil pengukuran atau implikasi dari hasil pengukuran. Tyler menekankan pada pencapaian tujuan suatu program, sedang Griffin & Nix lebih menekankan pada penggunaan hasil penilaian. B. Penilaian Kegiatan penilaian dan evaluasi memerlukan data hasil pengukuran. Alat ukur yang digunakan untuk mengumpulkan data bisa berupa tes dan nontes. Tes yang baik harus mewakili domain yang diukur dan mengukur tingkat berfikir yang tepat. Domain yang diukur ini adalah bahan ajar yang dapat dilihat pada silabus mata pelajaran. Informasi yang akurat berasal dari sejumlah pengukuran, yaitu yang dilaksanakan sepanjang semester. Bentuknya bisa berupa tugas, ulangan mingguan, dan ulangan pertengahan dan ulangan akhir semester. Dengan demikian pencapaian belajar peserta didik pada suatu bidang studi dapat diketahui. Alat ukur yang digunakan harus diusahakan agar memberikan data yang sahih (valid) dan andal (reliable). Sahih berkaitan dengan sampel bahan ajar yang diujikan mewakili isi kurikulum. Sampel bahan ajar digunakan dalam menyusun kisi-kisi instrumen 3 4 tes karena waktu untuk ujian singkat, sedang bahan ajar pada kurikulum cukup banyak. Sampel bahan ajar yang dipilih adalah yang esensi, memiliki nilai aplikasi, dan sering digunakan. Andal berkaitan dengan kesalahan pengukuran, yang dinyatakan dengan koefisien keandalan. Semakin tinggi koefisien keandalan akan semakin rendah kesalahan pengukuran Batas minimum koefiesn keandalan yang diteirma adalah 0,70. Namun ada yang mensyuaratkanlebih tinggi dari 0,70, tergantung pada resiko hasil pengukuran. Penilaian hasil pembelajaran harus mencakup ranah kognitif, afektif, dan psikomotorik. Sesuai dengan karakteristiknya teknik penilaian untuk ketiga ranah tersebut tidak sama. Untuk ranah kognitif bisa dilakukan dengan tes tertulis, ranah psikomotor dengan tes perbuatan, dan ranah afektif melalui pengamatan, inventori, atau kuesioner. Hasil penilaian ketiga ranah tersebut akan memberikan informasi tentang kompetensi peserta didik. Informasi ini diperlukan untuk merancang program perbaikan atau remedi. Penilaian memerlukan instrumen tes atau nontes untuk memperoleh informasi yang diperlukan. . Peserta didik dalam menjawab pertanyaan suatu intrumen tes melibatkan proses berpikir atau prilaku mental. Proses berpikir yang terlibat dalam menjawab pertanyaan dalam tes bertingkat, yaitu memahami, penyelesaian masalah, berpikir kritis, dan kreatif. Prilaku mental yang diprlukan dalam menjawab pertanyaan dapat dilihat pada kata kerja yang digunakan pada isntrumen tes. digunakan dalam mengembangkan Klasifikasi prilaku mental dan kata kerja yang instrumen tes disajikan pada Tabel 1. Tabel 1 Tabel 1. Tipe Kemampuan Mental dan Kata Kerja yang digunakan dalam Tes Prilaku Mental Kata kerja kunci Pemahaman Definisikan, deskripsikan, beri contoh, tunjukkan, dan ceritakan Penyelesaian masalah Jawablah, hitunglah, simpukan, tentukan, selesaikan Berpikir kritis Analisis, bandingkan, beri kritik, hipotesiskan, evaluasi, prediksi, judge Kreatifitas Bangun suatu konstruk, rancang, tamplikan, buatlah, tuliskan, 4 5 Tabel 2. Bentuk penilaian, deksripsi, dan manfaatnya Penilaian Wawancara Cerita atau tes bercerita Contoh tulisan Projek/pameran Deskripsi Manfaat Guru menanyakan peserta didik Informal dan kontek luwes tentang bacaan, minat Dilakukan untuk semua peserta didik Mencatat jawaban wawancara Peserta didik menceritakan ide Peserta didik menghasilkan utama suatu teks ysng dibaca laporan lisan yang dapat diskor atau yang didengar dengan menggunakan rubrik atau rating Peserta didik menghasilkan Peserta didik menghasilkan makalah dalam bentuk narasi dokumen tertulis yang dapat diskor isi dan kalimatnya dengan menggunakan rubrik Peserta didik melakukan Peserta didiik megerjakan suatu presentasi formal, laporan tertulis projek individual atau kelompok Dapat mengamati produk tulisan atau lisan, dan ketrampilan berpikir Peserta didik melakukan Eksperimen/demon eksperimen atau mendemonstrasikan material strasi yang digunakan Peserta didik ,membuat presentasi lisan, laporan tertulis, atau keduanya. Dapat diskor dengan rubric atau skala rating Peserta didik memberi respons Peserta didik menghasilkan laporan tertulis, diskor dengan Response yang tertulis rubrik atau skala rating dikonstruksi Items Guru mengamati atensi peserta Pengaturan ruang kelas Pengamatan guru didik, respons terhadap bahan Merekam hasil pengamatan ajar, atau interaksi dengan catatan anekdot, atau skala rating peserta didik lain Portfolio Fokus pada koleksi karya peserta Mengintegrasikan informasi dari didik untuk menunjukkan berbagai sumber kemajuannya antar waktu Memberikan gambaran lengkap tentang unjuk kerja peserta didik Peserta didik terlibat banyak dan dapat melakukan penilaian sendiri 5 6 menunjukkan ada 4 (empat) klasifikasi prilaku mental, dan tiap klasifikasi disertai dengan kata kerja yang digunakan dalam menyusun tes. (Haladyna, 1997: 32). Bentuk penilaian dapat dikategorikan menjadi dua, yaitu bentuk pilihan dan bentuk uraian. Pada bentuk pilihan dalam menjawab pertanyaan peserta didik berpikir kemudian menentukan pilihan jawaban. Pada tes bentuk ini, tidak diketahui proses berpikir peserta didik dalam memilih jawaban, bahkan peserta didik yang tidak berpikir atau tidak membaca soal dapat menjawab pertanyaan Tes bentuk ini cocok untuk tes skala luas, seperti ujian nasional, tes seleksi masuk ke perguruan tinggi. Pada tes bentuk uraian peserta didik diminta untuk menuiliskan jawaban dalam bentuk kalimat atau penyelesaian soal, sehingga dapatdiketahui proses berpikir atau penalaran peserta didik dalam menjawab soal ujian. Dengan menelusuri jawaban peserta didik akan diketahui penalaan atau proses berpikir peserta didik dalam menjawab pertanyaan. . Beberapa bentuk penilaian, deksripsi dan manfaat disajikan pada Tabel 2. Tabel 2 menunjukkan bahwa ada sejumlah bentuk penilaian yang dapat dikategorikan sebagai penilaian unjuk kerja dan penilaian otentik. Setiap bentuk penilaian memiliki cara pemberian skor yang tepat, seperti karya tulis peserta didik bisa diskor dengan menggunakan rubrik atau dengan skala rating 1 sampai 5 misalnya.. C. Penilaian Otentik Penilaian otentik adalah kegiatan untuk mengetahui pengetahuan dan atau ketrampilan peserta didik melalui pertanyaan pada level berpikir aplikasi atau lebih tinggi yang menuntut jawaban secara tertulis atau lisan. Penilaian otentik dilaksanakan secara kontinu dalam kontek lingkungan belajar atau dunianyata yang bermakna yang merefleksikan pengalaman belajar sesungguhnya. Informasi ini diperoleh melalui observasi, portfolio, eksprimen, anekdot, jurnal, contoh pekerjaan dalam konteks dunia nyata. Melalui penilaian otentik akan diperoleh informasi kemampuan peserta didik yang sebenarnya, karena tidak ada unsur tebakan dalam menjawab pertanyaan. Peserta didik dituntut untuk menggunakan konsep atau keterampilan dalam kontek dunia nyata. Bentuk penilaian ini dapat digunakan pada proses pembelajaran di kelas. Hal ini sesuai dengan tuntutan penggunaan sistem penilaian terpadu pada kurikulum 2013. 6 7 Tingkat berpikir yang digunakan pada penilaian otentikpada level aplikasi sampai pada level kreasi dalam konteks lingkungan sekitarnya. Artinya kontek pertanyaan adalah yang terdapat di lingkungan. Tujuan penilaian otentik adalah untuk mengetahui kemampuan peserta didik dalam konteks dunia nyata (real world). Pada penilaian ini peserta didik belajar bagaimana menerapkan pengetahuan dan keterampilan yang dimiliki pada tugastugas otentik. Bentuk pertanyaan pada soal penilaian otentik di atas level hapalan, yaitu keterampilan analitik, kemampuan mengintegrasikan apa yang dipelajari; kreativitas; kemampuan bekerjasama, Penilaian otentik menghargai proses belajar dan hasilnya sebagai suatu produk. Komparasi penilaian tradisional penilaian otentik disajikan pada Tabel. 3. Tabel 3. . Komparasi Penilaian Tradisonal dan Otentik Tradisional Otentik Memilih jawaban Situasi dikarang Hapalan Bukti tidak langsung Menampilkan suatu karya Kehidupan nyata Konstruksi/aplikasi Bukti langsung Contoh objek penilaian otentik adalah: kegiatan melakukan percobaan bidang sains, melakukan penelitian bidang sosial, menulis cerita, membaca dan menafsirkannya, penyelesaian masalah matematika atau sains yang memiliki aplikasi pada dunia nyata. Pada penilaian bentuk ini peserta didik dituntut tidak hanya sekedar hapal formula tetapi lebih dari itu yaitu mampu menerapkannya dalam kontek kehidupan sehari-hari. Penilaian ini mendorong peserta didik untuk belajar lebih luas dan dalam agar mampu menerapkan pengetahuan dan keterampilannya dalam kehidupan sehari-hari. Pada model tradisional, guru tidak disarankan mengajarkan tes, karena materi tes merupakan sampel dari pengetahuan atau ketrampilan yang diajarkan. Kemampuan peserta didik yang dilihat dari hasil tes belum merupakan gambaran kemampuan keseluruhan yang dimiliki peserta didik. Jadi guru tidak dianjurkan melaksanakan pembelajaran bedasarkan tes. . Pada penilaian otentik, guru didorong untuk mengajarkan tes. Peserta didik perlu belajar bagaimana menyajikan tugas-tugas yang bermakna, guru menunjukkan model- model kinerja yang baik. Jawaban terhadap suatu pertanyaan bisa tidak satu, sehingga akan 7 8 diperoleh informasi originalitas jawaban peserta didk. Dalam hal ini akan berkembang kemampuan berpikir divergent peserta didik. Menurut Nitko &Brookhart (2007:253) penilaian otentik memiliki kesamaan dengan penilaian unjuk kerja atau penilaian kinerja. Pada penilaian kinerja, peserta didik dituntut menerapkan pengetahuan atau keterampilan yang dimiliki, tetapi belum tentu aplikasi pada konteks dunia nyata. Peringkat berpikir yang terlibat dalam mengerjakan tugas pada penilaian unjuk kerja sama dengan pada penilaian otentik, bedanya adalah konteks pertanyaannya yang berbeda. Menurut Nitko dan Brookhart (2007:253) penilaian unjuk kerja kadang-kadang disebut sebagai penilaian bermakna atau penilaian otentik. Selanjutnya dijelaskan bahwa menurut perspektif filsafat pendidikan, kata otentik dalam penilaian otentik berarti menyajikan peserta didik dengan tugas-tugas yang secara langsung bermakna terhadap pendidikan dan bukan secara tidak langsung. Sebagai contoh, membaca sejumlah kalimat yang panjang dan menggunakannya untuk membandingkan dan menkontraskan sudut pandang sosial yang berbeda secara langsung bermakna, karena -kalimat yang panjang membuat orang berpikir lebih luas. Sebaliknya penyajian kalimat yang pendek-pendek, dan peserta didik diminta memilih jawaban, misalnya apa judul karangan tersebut. Contoh ini menunjukkan bahwa penggunaan kalimat dari potongan cerita, kemudian peserta didik diminta memilih jawaban, hal ini merupakan penilaian tidak langsung. Pengembangan penilaian otentik yang baik adalah dimulai dengan mengidentifiksi standar bagi peserta didik.Standar menjadi acuan dalam melaksanakan pembelajaran dan dalam melakukan penilaian.Standar yng menjadi acuan adalah standar isi dari kurikulum yang digunakan. Pada penilaian otentik peserta didik diberi tugas untuk memecahkan masalah di lingkungannya. Menurut Wiggin, (1990), tugas otentik memiliki 6 (enam) karakteristik, sebagai berikut.. 1. Menggunakan pengetahuan untuk mengerjakan tugas yang bermakna. 2. Menggunakan kombinasi pengetahuan, dan keterampilan. 3. Menghasilkan 4. Menggunakan produk yang berkualitas standard dan kriteria untuk penilaian. 8 9 5. Mendorong peserta didik menggunakan berbagai cara untuk memecahkan masalah. 6. Memberi tantangan kepada peserta didik. Melalui penilaian otentik potensi berpikir peserta didik akan berkembang secara optimal menjadi kemampuan. Menyusun soal tes untuk penilaian otentik diperlukan kemampuan berpikir tinggi dan kreatif dalam memilih kondisi yang diperlukan. Untuk itu gurun harus berlatih dan banyak membaca agar timbul ide-ide baru dalam menyusun tes yang baik. . ___________________________________________________________________ Daftar Pustaka Allen, Mary, J., & Yen, Wendy, J (1979). Introduction to measurement theory. California: Brooks/Cole Publishing Company. Andersen, L. W., & Krathwohl. (2001). A Taxonomy for learning, teaching and assessment. Boston: Longman. Berk, R. A. (1986, Ed). Performance assessment. Baltimore: The John Hopkins University Press. Djemari Mardapi. (2012). Pengukuran, penilaian, dan evaluasi pendidikan. Yogyakarta: Medica Publishing. Haladyna, Thomas. M. (1997). Writing test items to evaluate higher order thinking. Boston: Allyn and Bacon Nitko, J. Anthony., Brookhart, Susan. M. (2007) . Educational assessment of students.Singapore: Pearson Merril Prentice Hall. O’malley, J. Michael., Pierce, Valdez. Lorraine (1996) .Authentic assessment for English language learners. USA. Addition Wesley Publishing Company. Johnson, D. W., & Johnson, R. T. (2002). Meaningful assessment. Boston:: Allen & Bacon. 9