Pengembangan Tes Diagnostik Suwarto Program Studi Pendidikan Biologi FKIP. Universitas Veteran Bangun Nusantara Sukoharjo Jl. Sujono Humardani No.1 Jombor Sukoharjo Jawa Tengah Kode Pos: 57521 Email: [email protected] Abstrak, tes digunakan untuk beberapa tujuan, namun tidak akan memiliki keefektifan yang sama untuk semua tujuan. Tes diagnostik berguna untuk mengetahui kesulitan belajar yang dihadapi siswa, termasuk kesalahan pemahaman konsep. Secara umum tes diagnostik dikembangkan untuk mengetahui kelemahan-kelemahan siswa sedang tes prestasi dikembangkan untuk mengetahui kemampuan-kemampuan siswa setelah mengikuti serangkaian proses pembelajaran. Tes diagnostik dikembangkan melalui tahapan: (1) menyusun spesifikasi tes, (2) menulis soal tes, (3) menelaah soal tes, (4) melakukan ujicoba tes, (5) menganalisis butir soal, (6) memperbaiki tes, (7) merakit tes, (8) melaksanakan tes, (9) menafsirkan hasil tes. Kata-kata Kunci: Tes Diagnostik Developing Diagnostic Test Suwarto Biology Education program. Teacher Training and Education Faculty Veteran Bangun Nusantara University of Sukoharjo Jl. Sujono Humardani No.1 Jombor Sukoharjo Jawa Tengah. Email: [email protected] Abstract, The test is used for several objectives, but it would not find the same effectiveness for all objectives. Diagnostic test is used to find out the learning difficulties faced by learners, including the misconception. Generally, diagnostic test is developed to find out the weaknesses of the learners, while the achievement test is developed to find out the students capability after following learning process series. Diagnostic test is developed through the following steps: (1) arranging test specification, (2) writing test items, (3) understanding test items, (4) doing tryout, (5) analizing test item, (6) correcting test, (7) assembling test, 98) implementing test, (9) interpreting test result. Keywords: Diagnostic Test 187 188 JURNAL PENDIDIKAN, VOLUME 22, NOMOR 2, JULI 2013 Pendahuluan Tujuan tes yang penting adalah untuk: (a) mengetahui tingkat kemampuan siswa, (b) mengukur pertumbuhan dan perkembangan siswa, (c) mendiagnosis kesulitan belajar siswa, (d) mengetahui hasil pengajaran, (e) mengetahui hasil belajar, (f) mengetahui pencapaian kurikulum, (g) mendorong siswa belajar, dan (h) mendorong guru agar mengajar yang lebih baik. (Djemari Mardapi, 2004: 72). Seringkali tes digunakan untuk beberapa tujuan, namun tidak akan memiliki keefektifan yang sama untuk semua tujuan. Ditinjau dari tujuannya, ada empat macam tes yang banyak digunakan di lembaga pendidikan, yaitu: (a) tes penempatan, (b) tes diagnostik, (c) tes formatif, dan (d) tes sumatif. Pengujian berbasis kemampuan dasar pada umumnya menggunakan tes diagnostik, formatif, dan sumatif. Tes penempatan dilaksanakan pada awal pelajaran, digunakan untuk mengetahui tingkat kemampuan yang telah dimiliki siswa. Untuk mempelajari suatu mata pelajaran dibutuhkan pengetahuan pendukung. Pengetahuan pendukung ini diketahui dengan menelaah hasil tes penempatan. Apakah seseorang siswa perlu matrikulasi, tambahan pelajaran atau tidak, ditentukan dari hasil tes ini. Tes diagnostik berguna untuk mengetahui kesulitan belajar yang dihadapi siswa, termasuk kesalahan pemahaman konsep. Tes diagnostik dilakukan apabila diperoleh informasi bahwa sebagian besar siswa gagal dalam mengikuti proses pembelajaran pada mata pelajaran tertentu. Dengan demikian tes diagnostik sangat penting dalam rangka membantu siswa yang mengalami kesulitan belajar dan dapat diatasi dengan segera apabila guru atau pembimbing peka terhadap siswa tersebut. Hasil tes diagnostik memberikan informasi tentang konsep-konsep yang belum dipahami dan yang telah dipahami. Oleh karena itu, tes ini berisi materi yang dirasa sulit oleh siswa, namun tingkat kesulitan tes ini cenderung rendah. Tes formatif bertujuan untuk memperoleh masukan tentang tingkat keberhasilan pelaksanaan proses pembelajaran. Masukan ini berguna untuk memperbaiki strategi mengajar. Tes ini dilakukan secara periodik sepanjang semester. Materi tes dipilih berdasarkan tujuan pembelajaran tiap pokok bahasan atau sub pokok materi. Jadi tes ini sebenarnya bukan untuk menentukan keberhasilan belajar semata, tetapi untuk mengetahui keberhasilan proses pembelajaran. Tes sumatif diberikan diakhir suatu pelajaran, atau akhir semester. Hasilnya untuk menentukan keberhasilan belajar siswa. Tingkat keberhasilan ini dinyatakan dengan skor atau nilai, pemberian sertifikat, dan sejenisnya. Tingkat kesukaran soal pada tes sumatif bervariasi, sedang materinya harus mewakili bahan yang telah diajarkan. (Djemari Mardapi, 2004: 72). Secara umum tes diagnostik dikembangkan untuk mengetahui kelemahankelemahan siswa sedang tes prestasi dikembangkan untuk mengetahui kemampuankemampuan siswa setelah mengikuti serangkaian proses pembelajaran. Perbedaan tes diagnostik dan tes prestasi dapat dirangkum dalam suatu tabel sehingga memudahkan dalam mendalami perbedaan tes diagnostik dan tes prestasi. Suwarto, Pengembangan Tes Diagnostik 189 Tabel 1. Perbedaan Tes Diagnostik dan Tes Prestasi Aspek Fokus pengukuran Sampel Waktu pelaksanaan Kegunaan hasil Kesulitan butir Daya beda butir Tes Diagnostik Kesulitan belajar Terbatas Selama pengajaran Memperbaiki kelemahan atau kesulitan siswa Tingkat kesulitan relatif mudah Daya beda butir rendah dapat digunakan, karena penggunaan tes diagnostik bukan untuk membedakan kemampuan antar siswa tetapi untuk mengetahui materi pelajaran sudah dikuasai atau belum oleh siswa Tes Prestasi Tujuan pembelajaran Luas Secara periodik atau akhir pembelajaran Sebagai umpan balik, menentukan kelas, dan menandai penguasaan Tingkat kesulitan meliputi mudah, sedang, dan sulit Daya beda butir 0,4 keatas. Semakin tinggi semakin baik karena semakin dapat membedakan kemampuan siswa Tes Diagnostik Menurut Brueckner & Melby (1981: 73), tes diagnostik digunakan untuk menentukan elemen-elemen dalam suatu mata pelajaran yang mempunyai kelemahan-kelemahan khusus dan menyediakan alat untuk menemukan penyebab kekurangan tersebut. Ada beberapa tipe tes diagnostik: (1) The Compass Arithmetics Tests, tes yang berguna untuk mencari kelemahan siswa berkenaan dengan berbagai unsur yang mendasari keseluruhan proses. (2) The Brueckner Diagnostics Tests, tes yang berguna untuk mencari kelemahan siswa berkenaan dengan pecahan dan sistem desimal. Hughes (2003: 15) menyatakan bahwa, tes diagnostik dapat digunakan untuk mengetahui kekuatan dan kelemahan siswa dalam belajar. Tujuan penggunaan tes ini adalah untuk menentukan pengajaran yang perlu dilakukan dimasa selanjutnya. Tes diagnostik adalah alat atau instrumen yang digunakan untuk mengidentifikasi kesulitan belajar. Setiap tes disusun untuk menentukan satu atau lebih ketidakmampuan siswa. Guru harus mengetahui dimana seharusnya memulai pengajaran dan ketrampilan apa yang harus ditekankan. Jika tidak, kelemahan siswa tidak akan diketahui dan program pengajaran pendahuluan tidak dapat dibuat. Oleh karena itu diagnosis yang teliti merupakan hal penting untuk menyesuaikan semua aspek pengajaran seperti tujuan, materi pelajaran dan teknik mengajar dengan kebutuhan siswa (Hopkins dan Antes, 1979: 56). Menurut Thorndike dan Hagen (2005: 172) tes diagnostik pada intinya mencari kembali kebelakang tentang kesulitan yang muncul dan berkembang. Untuk menemukannya tidak bisa dilakukan dengan segera, diperlukan sebuah analisis kemampuan yang lengkap dan seksama. Biasanya menggunakan tes diagnostik yang soal-soalnya disusun dari yang mudah hingga ke yang sukar. Menurut Mehrens & Lehmann (1984: 410) tes diagnostik yang baik dapat memberikan gambaran yang akurat tentang miskonsepsi yang dimiliki siswa berdasarkan informasi kesalahan yang dibuatnya. Menurut Gorin (Leighton & Gierl, 2007: 174) tes diagnostik yang baik adalah tes yang dapat menunjukkan apakah seseorang telah menguasai ketrampilan atau belum. Menurut Zeilik (1998: 1) tes diagnostik digunakan untuk menilai pemahaman konsep siswa terhadap konsep-konsep 190 JURNAL PENDIDIKAN, VOLUME 22, NOMOR 2, JULI 2013 kunci (key concepts) pada topik tertentu, secara khusus untuk konsep-konsep yang cenderung dipahami secara salah. Berdasarkan pendapat ini, dapat didefinisikan ciri-ciri tes diagnostik, yaitu topik terbatas dan spesifik, serta ditujukan untuk mengungkap miskonsepsi, menyediakan alat untuk menemukan penyebab kekurangannya. Sion & Jingan (2008: 4) menyatakan bahwa tes diagnostik sebagai tes yang memberikan kepada guru informasi tentang kemampuan awal dan miskonsepsi siswanya sebelum memulai aktivitas belajar. Tes diagnostik juga memberikan informasi tentang batas terendah untuk memulai aktivitas belajar. Mehrens & Lehmann (1984: 462) menyatakan bahwa tes diagnostik bisa dianggap valid jika: (1) bagian-bagian tes kemampuan komponen harus menekankan hanya pada satu jenis kesalahan; dan (2) perbedaan-perbedaan bagian tes harus dapat dipercaya. Menurut Gronlund (1985: 120) tes diagnostik harus disusun secara khusus pada wilayah pengajaran yang terbatas. Butir-butir tes diagnostik cenderung mempunyai tingkat kesulitan yang relatif rendah. Menurut penulis pengertian tes diagnostik adalah tes yang digunakan untuk mengetahui kelemahan (miskonsepsi) pada topik tertentu dan mendapatkan masukan tentang respon siswa untuk memperbaiki kelemahannya. Diagnostik dalam pendidikan dan diagnostik dalam medis mempunyai banyak persamaan, tetapi diagnostik dalam pendidikan adalah lebih luas. Diagnostik dalam medis utamanya terkait dengan kondisi-kondisi penyakit atau dengan beberapa macam cacat struktural. Terlebih lagi, kondisi penyakit sering dikarenakan beberapa sebab spesifik, seperti jenis kuman tertentu atau suatu kondisi beracun, yang dapat diisolasi dan diobati secara langsung. Dalam kasus lainnya masalah tersebut dapat berupa malfungsi beberapa organ atau kelenjar tubuh, yang dapat diatasi dengan perawatan medis atau operasi yang tepat. Cacat penglihatan dan pendengaran yang serius, atau cacat tubuh karena kecelakan dan penyakit, ini merupakan ruang lingkup dalam medis. Bagaimanapun, diagnosis dalam pendidikan tidak terbatas dalam kasus-kasus semacam itu, tapi dalam bidang yang lebih luas. Banyak kesulitan-kesulitan pembelajaran serius tidak dikarenakan oleh cacat struktural tapi oleh pembentukan perilaku yang buruk, yaitu gerakan-gerakan mata yang salah dalam membaca dan beragam kesalahan dalam bahasa lisan maupun tertulis merupakan contoh yang tepat. Lebih lanjut, kesulitan biasanya muncul bukan dari satu sebab tapi dari banyak faktor yang berlangsung bersamaan. Khasnya, situasi pembelajaran adalah hal yang rumit dan tidak sederhana. Proses pembelajaran kapanpun disesuaikan dengan banyak faktor, sebagian di dalam dan sebagian di luar pelajar. Faktor-faktor ini dapat dikelompokkan secara kasar sebagai berikut: (1) Faktor-faktor internal: (a) Fisik: peralatan panca indra, status kesehatan, tingkat kedewasaan, dan sebagainya; (b) Intelektual: kecerdasan umum, bakat-bakat dan kekurangan-kekurangan khusus, dan sebagainya; (c) Emosi: sikap, minat, dorongan, prasangka, dan sebagainya; (d) Pendidikan: latar belakang, kebiasaan kerja, dan sebagainya. (2) Faktor-faktor eksternal: (a) Lingkungan sekolah: program pendidikan, guru, kurikulum, peralatan, dan sebagainya; (b) Lingkungan luar sekolah: rumah, masyarakat, gereja, dan sebagainya. Diagnosis dalam pendidikan merupakan konsep yang luas, meliputi identifikasi kekuatan dan kelemahan siswa. Thorndike dan Hagen (2005: 173) menyatakan bahwa diagnosis adalah usaha untuk mengetahui kekuatan dan kelemahan siswa. Diagnosis dilakukan untuk membantu guru dalam menentukan dimana proses belajar mengajar yang Suwarto, Pengembangan Tes Diagnostik 191 telah atau belum dikuasai. Diagnosis kesulitan belajar dilakukan untuk memahami jenis, karakteristik dan latar belakang kesulitan-kesulitan belajar dengan menghimpun, mempergunakan berbagai data, informasi selengkap dan seobjektif mungkin sehingga memungkinkan untuk mengambil keputusan dan kesimpulan serta mencari alternatif kemungkinan pemecahannya. Penaksiran Diagnostik Menurut Nitko & Brookhart (2007: 296) ada enam pendekatan penaksiran diagnostik terkait dengan masalah pembelajaran, yaitu: (a) pendekatan profil kekuatan dan kelemahan kemampuan pada suatu bidang; (b) pendekatan mengidentifikasi kekurangan pengetahuan prasyarat; (c) pendekatan mengidentifikasi target-target pembelajaran yang tidak dikuasai; (d) pendekatan pengidentifikasian kesalahan siswa; (e) pendekatan mengidentifikasi struktur pengetahuan siswa; dan (f) pendekatan mengidentifikasi kompetensi untuk menyelesaikan soal cerita. Masing-masing pendekatan diagnosis dapat dijelaskan sebagai berikut. a. Pendekatan Profil Kekuatan dan Kelemahan Kemampuan pada Suatu Bidang Pada pendekatan ini, suatu mata pelajaran sekolah dibagi ke dalam bagian-bagian, dimana masing-masing bagian dianggap sebagai ciri atau kemampuan yang terpisah. Hasil diagnosis dilaporkan sebagai suatu profil kekuatan dan kelemahan siswa. Langkah-langkah berikut menggambarkan cara melakukan penaksiran diagnostik jenis ini. (1) Kenali dua atau lebih bidang kemampuan yang diinginkan untuk membuat profil setiap siswa. Masingmasing bidang kemampuan seharusnya berhubungan dengan target pembelajaran atas materi yang akan diajarkan. (2) Buatlah butir-butir untuk mengukur konsep-konsep dasar pada masing-masing bidang. Hal-hal yang perlu diperhatikan adalah: (a) Untuk penggunaan di ruang kelas, paling baik menggunakan soal-soal dengan jawaban tersusun atau jawaban pendek. (b) Jika memungkinkan, gunakan 12 sampai 25 butir untuk setiap bidang kemampuan. (c) Soal-soal tersebut harus mencakup konsep-konsep dan prosedur-prosedur yang paling mendasar pada masing-masing bidang kemampuan. Soal-soal untuk masingmasing bidang seharusnya mudah bagi siswa. (3) Himpunlah soal-soal ke dalam sub-subtes yang terpisah. Urutkan butir-butir soal dalam masing-masing subtes dari yang paling mudah ke yang paling sulit. (4) Kelola masing-masing subtes secara terpisah, dan gunakan petunjuk dan pemilihan waktu secara terpisah. Semua siswa harus mengerjakan subtes yang sama, memulai dan berhenti mengerjakan subtes secara bersama-sama. Nilai-nilai subtes adalah nilai-nilai yang diinterpretasikan secara diagnostik. Nilai total tidak memiliki nilai diagnostik. Tabel 2 menunjukkan hasil penyelenggaraan tes diagnostik tipe ini pada siswa. Test tersebut mencakup pelajaran Bahasa Inggris. Profil tersebut dapat dipahami oleh guru tentang kekuatan dan kelemahan siswa di kelas tersebut. Untuk masing-masing subtes, setiap siswa mendapatkan dua nilai: (a) nilai yang sesungguhnya, dinyatakan sebagai suatu pecahan dari nilai maksimal yang diperoleh, dan (b) peringkat siswa. Pada Tabel 2 tersebut menyertakan peringkat siswa agar supaya dapat diketahui kelemahan siswa dengan cepat. Semakin kecil angka peringkatnya berarti semakin baik siswa tersebut (siswa yang memiliki skor benar tertinggi menduduki peringkat 1). Pada contoh Tabel 2, peringkat yang paling buruk dilingkari. Guru menginterpretasikan kekuatan dan kelemahan siswa dengan 192 JURNAL PENDIDIKAN, VOLUME 22, NOMOR 2, JULI 2013 Tabel 2. Contoh Profil Kekuatan dan Kelemahan Siswa BIDANG BAHASA INGGRIS Idioms Vocab Grammar Reading Listening Betul Peringkat Betul Peringkat Betul Peringkat Betul Peringkat Betul Peringkat Ali 10/12 3.5 11/15 3 11/13 3 9/12 4 3/15 5 Budi 11/12 2 10/15 4.5 3/13 6 11/12 2 10/15 3 Cica 12/12 1 15/15 1 12/13 2 11/12 2 14/15 1 Dedi 3/12 6 10/15 4.5 10/13 4.5 2/12 6 1/15 6 Endang 5/12 5 3/15 6 10/13 4.5 6/12 5 4/15 4 Farida 10/12 3.5 14/15 2 13/13 1 11/12 2 12/15 2 menggunakan peringkat tersebut. Ali misalnya, lemah dalam listening dibandingkan dengan siswa-siswa lain di kelas tersebut. Budi yang secara umum mendapatkan nilai baik, tetapi ia meiliki kelemahan dalam grammar. Cica dan Farida kuat dalam seluruh bidang. Dedi dan Endang lemah di banyak bidang tetapi sedang-sedang saja dalam grammar. Pendekatan penaksiran diagnostik jenis ini sangat bermanfaat untuk membentuk kelompokkelompok di kelas. Kelompok heterogen yang terdiri dari siswa-siswa yang kuat dan siswasiswa yang lemah sehingga dapat bekerja dengan baik. b. Pendekatan Mengidentifikasi Kekurangan Pengetahuan Prasyarat 10. Pembelahan Sel Secara Mitosis 9. Telofase 8. Anafase 7. Metafase 6. Profase 5. Fase Istirahat (Interfase) 4. Organella-organella sel 3. Pembelahan sel secara amitosis 1. Reproduksi sel yang terjadi pada organisme bersel satu 2. Prosos pembelahan sel secara tak langsung Gambar 1. Hierarki Prasyarat Pembelahan Amitosis dan Mitosis Suwarto, Pengembangan Tes Diagnostik 193 Pendekatan ini mengeksplorasi apakah siswa-siswi tertinggal dikarenakan mereka tidak memiliki pengetahuan atau keahlian khusus yang dibutuhkan untuk memahami pelajaran yang akan datang. Langkah-langkah berikut menggambarkan cara melakukan penaksiran diagnostik jenis ini. Langkah pertama membuat suatu hierarki dari suatu target pembelajaran yang harus dicapai oleh siswa. Langkah berikutnya melakukan analisis untuk mengidentifikasi prasyarat-prasyarat yang harus dipahami oleh siswa untuk mencapai target pembelajaran tersebut. Untuk masing-masing prasyarat yang diidentifikasi, kemudian dianalisis lagi sehingga diperoleh suatu hierarki prasyarat. c. Pendekatan Mengidentifikasi Target-target Pembelajaran yang Tidak Dikuasai Pendekatan ini memusatkan penaksiran pada target-target yang penting dan spesifik dari tujuan pembelajaran yang diharapkan. Tes-tes pendek dibuat untuk mengukur keberhasilan dari masing-masing target pembelajaran. Perbedaan antara pendekatan ini dan pendekatan mengidentifikasi kekurangan prasyarat adalah guru hanya menaksir taget-target yang merupakan hasil pembelajaran, guru tidak menaksir target-target prasyarat. Informasi diagnostik yang ingin diperoleh dari pendekatan ini adalah suatu daftar target pembelajaran yang sudah dikuasai atau tidak dikuasai oleh siswa. Tabel 3. Diagnosis Target Pembelajaran Khusus yang Dikuasai dan Tidak Dikuasai Oleh Siswa Nama siswa Ali Budi Cica Dedi Endang Farida Target-target 1. Menyebut dan menjelaskan fungsi dari bagian-bagian sel [8 soal, kepenguasaan = 7/8] 2. Mendaftar substansisubstansi yang tersebar dan tidak tersebar melalui membran sel [6 soal, kepenguasaan = 5/6] 3. Menulis nama bagianbagian sel hewan dan sel tumbuhan [6 soal, kepenguasaan = 5/6] 4. Menerapkan konsepkonsep difusi, oksidasi, peleburan, pembelahan, kromosom, dan DNA untuk menjelaskan proses reproduksi [8 soal, kepenguasaan = 7/8] 7/8 8/8 7/8 2/8 5/8 6/8 4/6 6/6 5/6 5/6 3/6 1/6 5/6 5/6 5/6 4/6 2/6 4/6 5/8 7/8 7/8 7/8 3/8 6/8 194 JURNAL PENDIDIKAN, VOLUME 22, NOMOR 2, JULI 2013 Langkah-langkah pendekatan jenis ini meliputi: (1). Mengenal dan menulis pernyataan-pernyataan target pembelajaran yang merupakan hasil pembelajaran. (2). Untuk setiap target pembelajaran, buatlah empat sampai delapan butir soal. (3). Jika memungkinkan, mintalah guru lain untuk mereview setiap butir soal dan menaksir kecocokan butir soal dengan target pembelajaran. (4). Kelompokkan butir-butir soal ke dalam suatu tes tunggal jika target pembelajaran relatif pendek (kurang dari enam). (5). Berikan label lulus untuk setiap target pembelajaran jika nilai siswa telah melebihi dari passing grade yang telah ditentukan. (6). Lakukan penaksiran pada setiap siswa. Setelah melakukan penaksiran, nilailah target-target pembelajaran secara terpisah. Siapkan daftar nilai dimana guru dapat mencatat nilai setiap siswa pada setiap target pembelajaran. Gambar 6 menunjukkan sebuah contoh pendekatan jenis ini. Lingkaran-lingkaran pada gambar tersebut menunjukkan target-target pembelajaran yang tidak dikuasai oleh siswa. d. Pendekatan Pengidentifikasian Kesalahan Siswa Tujuan pendekatan ini adalah untuk mengidentifikasi kekeliruan-kekeliruan siswa. Ketika guru mengidentifikasi dan mengklasifikasi kekeliruan siswa, selanjutnya guru dapat memberikan pelajaran remidi. Tidak mudah menerapkan pendekatan ini karena memerlukan pengalaman dan keahlian yang memadai untuk mengidentifikasi kekeliruankekeliruan siswa. Kekeliruan siswa dapat disebabkan oleh satu atau lebih penyebab. Guru yang tidak berpengalaman dan tidak memiliki keahlian kemungkinan tidak mengetahui penyebab-penyebab kesalahan tersebut. Seringkali guru semacam itu akan berkata bahwa siswa “tidak berhati-hati” atau “membuat kekeliruaan yang ceroboh”. Bagaimanapun juga, kekeliruan-kekeliruan siswa jarang bersifat ceroboh atau acak. Justru kekeliruan-kekeliruan siswa sering kali bersifat sistematik. Guru dapat mencoba mengidentifikasi apa yang menjadi menyebabkan kekeliruan, atau aturan apa yang digunakan, sebelum menganggap sebagai kesalahan yang ceroboh atau acak. Mewawancarai siswa adalah cara terbaik untuk menemukan banyak kekeliruan pada siswa. Guru dapat meminta mereka untuk menjelaskan bagaimana mereka menyelesaikan sebuah soal, menjelaskan mengapa mereka menjawab seperti itu, memberitahukan aturan untuk menyelesaikkan suatu soal. e. Pendekatan Mengidentifikasi Struktur Pengetahuan Siswa Mengidentifikasi struktur pengetahuan siswa dapat dilakukan dengan menggunakan peta konsep. Peta konsep adalah cara grafis untuk merepresentasikan bagaimana seorang siswa memahami hubungan konsep-konsep yang utama dalam materi pelajaran. Peta konsep ini menunjukkan bahwa siswa tersebut memiliki pengetahuan yang benar-benar terorganisir dengan baik mengenai konsep-konsep pada unit pelajaran. Beberapa hubungan antar konsep atau konsep-konsep yang penting dapat terjadi hilang. Hal ini dikarenakan siswa tidak menguasai konsep-konsep tersebut. Guru dapat mengidentifikasi dimana seorang siswa memiliki mata rantai yang hilang. Suwarto, Pengembangan Tes Diagnostik 195 Bagaimana seorang siswa berpikir mengenai konsep-konsep dan keterkaitan hubungan konsep-konsep tersebut. Bagaimana siswa melihat konsep tersebut diatur, dan bagaimana kemungkinan konsep-konsep tersebut dihubungkan dengan konsep-konsep dan prosedur-prosedur lain yang telah dipelajari siswa. Hal ini bisa membantu guru menjelaskan mengapa siswa membuat kekeliruan, atau mengapa mereka memiliki kesulitan dalam menyelesaikan soal. Untuk mengetahui pengertian-pengertian peta konsep dari beberapa ahli dapat dipelajari pada teknik mendeteksi miskonsepsi. Contoh berikut adalah peta konsep mengenai batuan. Gambar 2. Peta Konsep Batuan f. Pendekatan Mengidentifikasi Kompetensi untuk Menyelesaikan Soal Cerita Pendekatan ini berpusat pada pendiagnosisan apakah siswa memahami komponenkomponen soal cerita. Penyelesaian soal cerita terdiri atas sejumlah target pembelajaran pada kajian-kajian sosial, matematika, dan ilmu pengetahuan alam. Diagnosis di dalam pendekatan ini adalah untuk mengidentifikasi siswa yang tidak dapat menyelesaikan soal cerita dan apakah kekurangan mereka terletak pada pengetahuan linguistik dan faktual, pengetahuan skematis, pengetahuan strategis, atau pengetahuan algoritmis. Seorang siswa mungkin tidak dapat menyelesaikan suatu soal karena siswa tersebut memiliki kekurangan salah satu atau lebih dari empat jenis pengetahuan ini. Pembelajaran remidi diperuntukkan bagi siswa yang kurang menguasai materi/konsep pembelajaran. Guru dapat 196 JURNAL PENDIDIKAN, VOLUME 22, NOMOR 2, JULI 2013 mengidentifikasi jenis-jenis pengetahuan yang kritis dari pengetahuan linguistik, pengetahuan skematis, pengetahuan strategis, dan pengetahuan algoritmis pada masingmasing soal cerita. Langkah-langkah Pengembangan Tes Diagnostik Mehrens & Lehmann (1973: 461-464) menyatakan bahwa tes diagnostik terutama terkait dengan kemampuan atau keterampilan (sebagai contoh: membaca, perhitungan, ejaan). Tes diagnostik berisikan butir-butir yang dirasa sulit bagi siswa. Diagnostik dilakukan untuk mengamati dan merekam kesalahan yang terjadi pada siswa dan melihat apakah ada pola kesalahan yang terjadi. Diagnostik tidak hanya menemukan macammacam kesalahan yang dibuat siswa tetapi juga memperoleh pengertian yang mendalam tentang bagaimana siswa menjawab. Tes diagnostik tidak hanya menginformasikan kepada guru mengenai kelemahan siswa tetapi juga menunjukkan domain apa yang lemah. Mengapa masalah ada di domain tersebut dan guru harus mempertimbangkan solusi yang layak untuk masalah tersebut. Tes diagnostik yang distandarisasi merupakan instrumen yang diatur dibawah kondisi yang sama dan membuat skor secara objektif. Tes diagnostik tidak diberikan kepada semua siswa tetapi diberikan kepada siswa yang mempunyai kesulitan. Langkah-langkah penting yang perlu dilakukan sebagai prosedur pengetesan diagnostik secara umum: (a). Harus ada analisis tertentu untuk kaidah, prinsip, pengetahuan atau keterampilan yang hendak diukur; (b). Tes diagnostik yang baik direncanakan dan disusun mencakup setiap kaidah dan prinsip dan diujikan dengan cara yang sama; (c). Umumnya butir soal disusun secara kelompok, hal ini dimaksudkan untuk memudahkan analisis dan diagnosis. Oleh karena itu, jika ada empat butir soal pada suatu kaidah yang sama maka ke empat butir soal tersebut disusun dalam satu kelompok dan tidak disebarluaskan ke dalam seluruh tes. Hal ini dimaksudkan agar lebih sederhana dalam menganalisis hasil untuk menentukan materi yang kuat dan yang lemah. Gersten, Jordan, & Flojo (2005) secara khusus untuk pemecahan masalah pada aritmatika menyatakan bahwa: “a standardized diagnostic test that provides more precise information on counting knowledge, counting procedures used to solve arithmetic problems, the ability to remember facts, and so forth is needed for elementary school children with dyscalculia, as is a corresponding measure for identifying preschool children who might be at risk.” David, C. G (2006) menambahkan pernyataan: “unfortunately, there is little research on effective instructional techniques that remediate this learning difficulty.” Allen dan Yen (1979: 227) mengemukakan bahwa dalam pengembangan tes acuan kriteria, masalah utama adalah menyangkut pembuatan spesifikasi tes secara cermat mengenai tujuan yang ingin diukur. Penulisan butir soal bertujuan untuk mengukur tujuan pembelajaran. Oleh karena itu setiap tujuan perlu diukur seefisien mungkin karena banyaknya tujuan khusus yang harus diukur. Butir soal yang diinginkan adalah butir soal yang dapat membedakan antara pengikut tes yang telah menguasai konsep dan yang belum menguasai konsep. Penilaian tes acuan kriteria (absolut) adalah pemberian nilai yang didasarkan atas tercapainya suatu standar atau kriteria penguasaan (competence) tertentu yang telah Suwarto, Pengembangan Tes Diagnostik 197 ditetapkan terlebih dahulu. Penilaian absolut akan melihat apakah subjek mampu melakukan tugas spesifik yang ada dalam tes. Penilaian kriteria biasanya digunakan dalam mastery testing dimana setiap tujuan tes dinyatakan dalam tujuan-tujuan spesifik yang jelas (Azwar, 2010: 168). Lima langkah pengembangan tes diagnostik yang bertujuan untuk penilaian kognitif menurut Nichols (1994: 587) adalah (1) berdasarkan konstruksi teori yang substantif. Teori yang substantif merupakan dasar dalam pengembangan tes berdasarkan penelitian atau review penelitian; (2) seleksi design. Design pengukuran digunakan untuk membuat konstruk butir yang dapat direspon dengan baik oleh peserta tes berdasarkan pengetahuan, ketrampilan yang spesifik atau karakteristik lain sesuai teori; (3) administrasi tes. Administrasi tes meliputi beberapa aspek yaitu format butir, teknologi yang digunakan untuk membuat alat tes, situasi lingkungan pada waktu pengetesan dan sebagainya; (4) skoring hasil tes yaitu penentuan nilai tes yang telah dilakukan; (5) Revisi, proses penyesuaian antara teori dan model, apakah tes yang dikembangkan mendukung teori atau tidak jika tidak maka harus direvisi. Ippel dan Lohman (Nichols, 1994: 597) menyatakan bahwa teori tes yang terbaru dalam pengembangan conitive diagnostic assessment adalah observasion design yang digunakan untuk menentukan konstruk dan menyusun butir serta measurement design yang digunakan untuk mengumpulkan dan mengkombinasikan respon. Djemari Mardapi (2004: 88) menyatakan bahwa untuk menyusun tes, langkahlangkah yang perlu ditempuh: (1) menyusun spesifikasi tes, (2) menulis soal tes, (3) menelaah soal tes, (4) melakukan ujicoba tes, (5) menganalisis butir soal, (6) memperbaiki tes, (7) merakit tes, (8) melaksanakan tes, (9) menafsirkan hasil tes. 1. Menyusun Spesifikasi Tes Menetapkan spesifikasi tes, yaitu berisi tentang uraian yang menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes. Spesifikasi yang jelas akan mempermudah dalam menulis soal, dan siapa saja yang menulis soal akan menghasilkan tingkat kesulitan yang relatif sama. Penyusunan spesifikasi tes mencakup kegiatan berikut: (1) menentukan tujuan tes, (2) menyusun kisi-kisi tes, (3) memilih bentuk tes, dan (4) menentukan panjang tes. Ditinjau dari tujuannya, ada empat macam tes yang banyak digunakan di lembaga pendidikan, yaitu: (a) tes penempatan, (b) tes diagnostik, (c) tes formatif, (d) tes sumatif (Thorndike & Hagen, 1977). Kisi-kisi berisi spesifikasi soal-soal yang akan dibuat. Kisi-kisi soal terdiri dari kolom dan baris. Kolom menyatakan standar kompetensi, kompetensi dasar, uraian materi, dan indikator. Baris menyatakan tujuan yang akan diukur atau diujikan. Untuk melengkapi isi kisi-kisi tersebut diperlukan silabus mata pelajaran atau kurikulum yang berlaku, dan buku teks sebagai pengendali supaya tidak keluar dari materi pelajaran. Bentuk tes objektif: pilihan ganda, benar salah, menjodohkan, dan uraian objektif. Tes uraian dapat dikategorikan uraian objektif dan uraian non objektif. Pemilihan bentuk tes yang tepat ditentukan oleh tujuan tes, jumlah peserta tes, waktu yang tersedia, untuk memeriksa lembar jawaban tes, cakupan materi tes, dan karakteristik mata pelajaran yang diujikan. 198 JURNAL PENDIDIKAN, VOLUME 22, NOMOR 2, JULI 2013 Penentuan panjang tes berdasarkan pada cakupan materi yang diujikan dan kelelahan peserta tes. Penentuan panjang tes berdasarkan pengalaman saat melakukan tes. Khusus untuk tes baku penentuan waktu berdasarkan hasil ujicoba. Waktu yang diperlukan untuk menyeluraiankan soal berdasarkan pada kompleksitas jawaban yang dituntut. Untuk mengatasi agar jawaban soal tidak terlalu panjang, sebaiknya jawaban dibatasi dengan beberapa kata atau beberapa halaman. Untuk keperluan tes diagnostik panjang tes akan terkait dengan seberapa banyak miskonsepsi yang ada, seberapa banyak cakupan materi yang akan diujikan, dan akan dipertimbangkan kelelahan peserta tes. 2. Menulis Soal Tes Penulisan soal merupakan langkah menjabarkan indikator menjadi pertanyaanpertanyaan yang karakteristiknya sesuai dengan perincian standar kompetensi dan kompetensi dasar pada kisi-kisi yang telah dibuat. Langkah ini perlu dilakukan secara hatihati agar keseluruhan tes dapat berkualitas baik. Kualita tes secara keseluruhan sangat terpengaruh dengan tingkat kebaikan dari masing-masing butir soal yang menyusunnya. Pertanyaan perlu dikembangkan dan dibuat dengan jelas dan simpel. Langkah-langkah untuk membuat tes uraian yang mencakup uraian objektif dan non-objektif telah diuraikan di depan, yaitu dalam menyusun butir tes uraian. 3. Menelaah Soal Tes Setelah butir-butir soal dibuat, kemudian dilakukan telaah pada butir-butir soal tersebut. Hal ini dilakukan untuk memperbaiki soal jika ternyata dalam pembuatan masih ditemukan kekurangan atau kesalahan. Validasi ahli yang professional diperlukan untuk kesempurnaan tes yang dibuat. Validasi bisa dari guru senior dan pakar dibidangnya. 4. Melakukan Ujicoba Tes Untuk keperluan standarisasi tes diagnostik yang disusun, diadakan pengumpulan data secara empiris melalui ujicoba dalam lingkungan terbatas. Maksud ujicoba adalah untuk meneiliti apakah tes diagnostik itu sudah dapat berfungsi dengan baik seperti yang diharapkan. Ujicoba juga untuk memperbaiki atau memilih butir soal yang terbaik untuk dijadikan bentuk akhir sesuai dengan tujuan pengembangan tes diagnostik yang dilakukan. Tujuan ujicoba adalah mengidentifikasi taraf kesukaran butir tes, daya pembeda butir tes, menentukan alokasi waktu yang layak, reliabilitas tes. Jika memang soal yang disusun belum memenuhi kualitas yang diharapkan, berdasarkan hasil ujicoba tersebut maka kemudian dilakukan pembenahan atau perbaikan. Suwarto, Pengembangan Tes Diagnostik 199 5. Menganalisis Butir Soal Analisis butir soal dilakukan untuk masing-masing butir, sehingga dapat diketahui: tingkat kesulitan butir soal, daya pembeda butir soal. Selain itu dapat diketahui reliabilitas, dan validitas tes yang tersusun. Pemilihan butir-butir tes yang baik perlu diperhatikan, dalam teori tes klasik dua parameter yang paling banyak digunakan, yaitu tingkat kesukaran butir tes dan daya pembeda butir tes. Suryabrata (1987: 96). Djemari Mardapi (2002) menyatakan bahwa besarnya tingkat kesukaran butir yang dapat diterima adalah dari 0,3 sampai 0,8. Tingkat kesukaran butir diartikan sebagai tingkat pencapaian hasil belajar. Karakteristik utama butir tes acuan kriteria tercermin dari besarnya indeks sensitivitas atau efek pembelajaran yang menunjukkan keefektifan proses pembelajaran. Hal ini diketahui saat dilakukan ujian awal (pre test) yang dilakukan sebelum pembelajaran dan ujian akhir (post test) yang dilakukan setelah pembelajaran. Jika tidak ada ujian awal, maka dapat dilihat dari besarnya tingkat capaian butir tes berdasarkan ujian akhir. Jika tingkat capaian suatu butir kecil (banyak siswa yang gagal) maka proses pembelajaran tidak efektif atau butir tes tidak efektif mengukur suatu tujuan pembelajaran. Menurut Djemari Mardapi (1999: 7), daya pembeda butir tes adalah besarnya kemampuan butir tes membedakan peserta ujian yang pandai dengan yang kurang pandai. Kemampuan butir tes membedakan antara siswa yang berkemampuan tinggi dengan siswa yang berkemampuan rendah bukan merupakan hal yang penting untuk menilai mutu butir tes pada penilaian acuan kriteria. Surapranata (2004: 23) menyatakan bahwa angka yang menunjukkan besarnya daya pembeda berkisar antara -1 dan +1. Tanda negatif menunjukkan bahwa peserta tes yang kemampuannya rendah dapat menjawab benar sedangkan peserta tes yang kemampuannya tinggi menjawab salah. Dengan demikian soal yang indeks daya pembedanya negatif menunjukkan soal yang jelek kualitasnya. Berdasarkan uraian di atas daya pembeda pada tes diagnostik ini digunakan untuk menjamin tidak terdapat butir tes dengan daya pembeda negatif. Butir tes yang dapat membedakan siswa yang menguasai dan siswa yang belum menguasai memiliki indeks daya pembeda minimal 0,30 jika kurang maka butir tes tersebut perlu direvisi (Naga, 1992: 69). Untuk pengelompokan siswa dalam kemampuan tertentu sesuai hasil diagnosis diperlukan acuan penilaian. Sejalan dengan tujuan penilaian acuan kriteria, penskoran dilakukan dengan membandingkan skor hasil jawaban siswa dengan kriteria (standar) kemampuan yang telah ditetapkan. Berdasarkan pernyataan di atas dapat diartikan bahwa perlu ditentukan terlebih dahulu skor sebagai acuan penilaian. Peserta ujian dianggap telah berhasil dalam belajar apabila dia sedikitnya telah menguasai 80% dari kemampuan-kemampuan yang seharusnya dia capai. Dalam hal ini acuan ketuntasan belajar siswa diberikan kriteria sebagai berikut: (a). Siswa dikatakan tuntas belajar secara individu bila ia telah mencapai 65% penguasaan dari bahan pelajaran. (b). Siswa secara klasikal dikatakan tuntas dalam belajar bila di kelas tersebut telah terdapat 85% yang telah mencapai 65% penguasaan dari bahan pelajaran. 200 JURNAL PENDIDIKAN, VOLUME 22, NOMOR 2, JULI 2013 6. Memperbaiki Tes Setelah ujicoba dilakukan dan kemudian dianalisis, maka langkah berikutnya adalah melakukan perbaikan-perbaikan tentang bagian soal yang masih belum sesuai dengan yang diharapkan. Langkah ini biasanya dilakukan atas butir soal, yaitu memperbaiki masingmasing butir soal yang ternyata masih belum baik. Ada kemungkinan beberapa soal sudah baik sehingga tidak perlu direvisi, beberapa butir mungkin perlu direvisi, dan beberapa yang lain mungkin harus dibuang karena tidak memenuhi standar kualitas yang diharapkan. 7. Merakit Tes Setelah semua butir soal dianalisis dan diperbaiki, langkah berikutnya adalah merakit butir-butir soal tersebut menjadi satu kesatuan tes. Dalam merakit soal, diperlukan pengelompokan-pengelompokan butir soal yang mengungkap konsep-konsep yang sama. Untuk tes diagnostik urutan butir-butir perlu diurutkan pada materi atau konsep yang sama. 8. Melaksanakan Tes Tes yang telah disusun diberikan kepada testee untuk diseluraiankan. Pelaksanaan tes dilakukan sesuai dengan waktu yang tepat, karena bila waktu tidak tepat maka miskonsepsi yang ada pada siswa yang mengalami kesulitan belajar akan tetap ada dikarenakan proses perbaikan pembelajaran berikutnya tidak dapat berlangsung. 9. Menafsirkan Hasil Tes Hasil tes menghasilkan data kuantitatif yang berupa skor. Skor ini kemudian ditafsirkan sehingga dapat memberikan keputusan pada seserta tes tentang kelemahankelemahan yang dimilikinya. Untuk keperluan penafsiran tersebut diperlukan acuan penilaian kriteria, karena tujuan diadakan tes diagnostik adalah untuk mengetahui konsepkonsep mana yang lemah dan apa penyebabnya. Simpulan dan Saran Tes diagnostik untuk mengetahui kesulitan belajar yang dihadapi siswa, termasuk kesalahan pemahaman konsep. Tes diagnostik adalah tes yang digunakan untuk mengetahui kelemahan (miskonsepsi) pada topik tertentu dan mendapatkan masukan tentang respon siswa untuk memperbaiki kelemahannya. Untuk menyusun tes, langkah-langkah yang perlu ditempuh: (1) menyusun spesifikasi tes, (2) menulis soal tes, (3) menelaah soal tes, (4) melakukan ujicoba tes, (5) menganalisis butir soal, (6) memperbaiki tes, (7) merakit tes, (8) melaksanakan tes, (9) menafsirkan hasil tes. Suwarto, Pengembangan Tes Diagnostik 201 Sebaiknya para pendidik dapat berinovasi dalam mengembangkan tes diagnostik sendiri, karena tes diagnostik yang siap digunakan masih terbatas jumlah dan variasinya. Tes diagnostik yang digunakan dengan benar oleh seorang pendidik, maka akan dapat menyempurnakan pembelajaran berikutnya. Daftar Rujukan Allen, M.J. & Yen, W.M. (1979). Introduction to measurement theory. Monterey: Brooks/Cole Publishing Company. Azwar, S. (2010). Tes prestasi: Fungsi dan pengembangan pengukuran prestasi belajar. Edisi II. Yogyakarta: Pustaka Pelajar. Brueckner, L.J., & Melby, E.O. (1981). Diagnostic and remedial teaching. Boston: Houghton Mifflin Company. David, C. G. (2006). Dyscalculia at an early age: Characteristics and potential influence on socio-emotional development. Centre of Excellence for Early Childhood Development. Encyclopedia on Early Childhood Development. [Versi elektronik]. Diambil pada tanggal 14 Agustus 2006, dari: http://www.excellenceearlychildhood.ca/documents/GearyANGxp.pdf Djemari Mardapi. (1999). Estimasi kesalahan pengukuran dalam bidang pendidikan dan implementasinya pada ujian nasional. Yogyakarta: Universitas Negeri Yogyakrta. ______________. (2002). Bukti kesahihan dan keandalan alat ukur: tanggapan atas artikel “Tes keterampilan olah raga judo bagi mahasiswa“. Jurnal Kependidikan. No.1 tahun XXXII. Lembaga Penelitian UNY. ______________. (2004). Penyusunan tes hasil belajar. Yogyakarta: Program Pascasarjana Universitas Negeri Yogyakarta. Gronlund, N.E. (1985). Measurement and evaluation in teaching. (Ed 5). New York: Macmillan Publishing co.,Inc. Hopkins, C. D., Antes, R. L. (1979). Classroom testing. Itasca: F. E. Peacock Publishers, Inc. Hughes, A. (2003). Testing for language teacher. New York: Cambridge University Press. Leighton, J.P & Gierl, M.J. (2007). Cognitive diagnostic assessment for education: theory and applications. New York: Cambridge University Press. Mehrens, W.A., & Lehmann, I.J. (1973). Measurement and evaluation in education and psychology. New York: Holt, Rinehart and Winston. Inc. Naga, D.S. (1992). Pengantar teori tes pada pengukuran pendidikan. Jakarta: Besbats. Nichols. 1994. A framework for developing cognitively diagnostic assessments. Review of Educational Research. 64 (4), 575-603. Nitko, A.J., & Brookhart, S.M. (2007). Educational assessment of students. New Jersey: Pearson Merrill Prentice Hall. Sion, H. H. & Janidi Jingan. (2008). Diagnostic assessment in three (3) core subjects for primary and secondary education (mathematics, english language and science): Hands-on workshop for government primary and secondary I and II (year 7 & year 202 JURNAL PENDIDIKAN, VOLUME 22, NOMOR 2, JULI 2013 8) teachers Negara Brunei Darussalam. A Concept Paper. Department of Human Resource Development Department of Planning, Development and Research Ministry of Education. Diambil pada tanggal 3 Pebruari 2011, dari scholar.google.com. Surapranata, S. (2004). Analisis, validitas, reliabilitas dan interpretasi hasil tes implementasi kurikulum 2004. Bandung: P.T. Remaja Rosdakarya. Suryabrata, S.. (1987). Pengembangan tes hasil belajar. Jakarta: Rajawali. Thorndike, R.L., & Hagen, E.P. (2005). Measurement and evaluation in psychology and education. New York: John Wiley & Sons, Inc. Zeilik, M. (1998). Classroom assessment techniques conceptual diagnostic test. Diambil pada tanggal 26 juli 2006, dari: http://www.flaguide.org/cat/diagnostic/ diagnostic7.php