BAB II KAJIAN TEORETIK 2.1 Tinjauan Tentang Kualitas Berbicara tentang pengertian atau definisi kualitas dapat berbeda makna bagi setiap orang, karena kualitas memiliki banyak kriteria dan sangat bergantung pada konteksnya. Namun secara umum orang menyatakan bahwa kualitas adalah sesuatu yang mencirikan tingkat dimana suatu produk memenuhi keinginan dan harapan. Menurut Kamus Besar Bahasa Indonesia (KBBI) tahun 2009 bahwa: “Kualitas diartikan sebagai berikut: 1. Tingkat baik buruknya sesuatu atau kadar, 2. Derajat atau taraf (kepandaian, kecakapan, atau mutu)”. Dalam kamus besar Bahasa Indonesia edisi kedua Depdikbud (2008) diuraikan bahwa: “Kualitas sama halnya dengan sesuatu yang bermutu, baik dari segi kuantitas atau kuantitatifnya. Selain itu juga dalam kamus besar Bahasa Indonesia ada dua pengertian kualitas, yakni: 1. Kualitas merupakan tingkatan baik buruknya sesuatu kadar. 2. Kualitas adalah derajat atau taraf (kepandaian, kecakapan, dan sebagainya) dari pribadinya seseorang yang tingkah lakunya dapat dijadikan teladan dalam hidup bermasyarakat dan bernegara. 1 Ada dua segi umum tentang kualitas yaitu, kualitas rancangan dan kualitas kecocokan. Semua barang dan jasa dihasilkan dalam berbagai tingkat kualitas. Variansi dalam tingkat ini memang disengaja, maka dari itu istilah teknik yang sesuai adalah kualitas rancangan. Kualitas kecocokan adalah seberapa baik produk sesuai dengan spesifikasi dan kelonggaran yang disyaratkan oleh rancangan itu. Kualitas kecocokan dipengaruhi oleh banyak faktor, termasuk pemilihan proses pembuatan, latihan, dan pengawasan angkatan kerja serta jenis sistem kualitas yang digunakan. Dalam kenyataannya kualitas adalah konsep yang cukup sulit untuk dipahami dan disepakati. Dewasa ini kata kualitas mempunyai beragam interpretasi, tidak dapat didefinisikan secara tunggal dan sangat bergantung pada konteksnya. Beberapa definisi kualitas berdasarkan konteksnya perlu dibedakan atas dasar organisasi, kejadian, produk, pelayanan, proses, orang, hasil, kegiatan, dan komunikasi. Lebih lanjut pengertian kualitas mencakup pengertian produk, kualitas biaya, kualitas penyajian, kualitas keselamatan, dan kualitas normal. Dari beberapa pengertian yang dikemukakan dapat disimpulkan bahwa kualitas merupakan tingkat baik buruknya karakteristik produk dan jasa yang menunjukkan kemampuannya untuk memuaskan kebutuhan yang tampak jelas maupun tersembunyi. 2.2 Hakekat Tentang Tes Tes merupakan alat atau prosedur yang berupa pertanyaan, perintah, dan petunjuk yang ditujukan kepada testee untuk mengukur sesuatu dalam suasana tertentu melalui aturan-aturan yang telah ditentukan. 2 Menurut Sudijono (dalam F.L. Goodeneough, 2008: 67) bahwa: “Tes adalah suatu tugas atau serangkaian tugas yang diberikan kepada individu atau sekelompok individu dengan maksud untuk membandingkan kecakapan mereka satu dengan yang lain”. Sedangkan Kusaeri (2012: 6) mengemukakan bahwa: “Tes merupakan alat ukur berbentuk satu set pertanyaan untuk mengukur sampel tingkah laku dari peserta tes”. Selanjutnya Taruh (2008: 2) mengemukakan bahwa: “Definisi tes sebagai himpunan pertanyaan yang harus dijawab, atau tes dapat didefinisikan sebagai suatu pertanyaan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut pendidikan atau psikologik yang setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar”. Dengan demikian maka setiap tes menuntut keharusan adanya respon dari subyek (orang yang di tes) yang dapat dinyatakan sebagai suatu atribut yang dimiliki oleh subyek yang sedang dicari informasinya. Dalam kaitannya sebagai alat penilaian hasil belajar, tes minimal mempunyai dua fungsi, yaitu: 1. Untuk mengukur tingkat penguasaan terhadap seperangkat materi atau tingkat pencapaian terhadap seperangkat tujuan tertentu, fungsi ini lebih dititikberatkan untuk mengukur keberhasilan program pengajaran. 2. Untuk menentukan kedudukan atau peringkat siswa dalam kelompok tentang penguasaan materi atau pencapaian tujuan tertentu, fungsi lebih dititikberatkan untuk mengukur keberhasilan belajar masing-masing individu peserta tes. 3 Pengukuran hasil belajar dapat digunakan dua macam tes, yaitu tes standar dan tes buatan guru (Arikunto, 2009: 146-147). 2.2.1 Tes Standar Dan Tes Buatan Guru Tes standar biasanya digunakan pada banyak sekolah yang mencakup wilayah yang luas. Dalam penyusunan tes standar ini pada umumnya oleh satu tim ahli atau lembaga khusus. Tes ini sudah distandarisasi, artinya tes tersebut telah mengalami proses validasi (ketepatan) dan reliabilitasi (ketetapan) untuk suatu tujuan tertentu dan untuk sekelompok siswa tertentu (Sudjana 2009: 113). Tes yang dipergunakan di sekolah-sekolah pada umumnya adalah tes buatan guru sendiri. Tes ini belum distandarisasi, sebab dibuat oleh guru untuk tujuan tertentu dan untuk siswa tertentu pula (Sudjana, 2009: 114). Tes tersebut digunakan untuk mengetahui seberapa jauh para siswanya telah menguasai mata pelajaran yang diberikan oleh guru, dilihat berdasarkan hasil belajar yang diperoleh setiap siswa. Dari kedua penjelasan di atas dapat disimpulkan bahwa terjadi perbandingan antara tes standar dan tes buatan guru, seperti dalam Tabel 1 berikut ini: 4 Tabel 1: Perbandingan Antara Tes Standar Dan Tes Buatan Guru No. 1) Tes standar Tes buatan guru Didasarkan atas bahan dan tujuan Didasarkan atas bahan dan umum dari sekolah-sekolah di seluruh tujuan negara. khusus yang dirumuskan oleh guru untuk kelasnya sendiri. 2) Mencakup aspek pengetahuan yang luas dan Dapat terjadi hanya mencakup atau keterampilan pengetahuan atau dengan hanya sedikit butir tes untuk keterampilan yang sempit. setiap keterampilan atau topik. 3) Disusun dengan kelengkapan staf Biasanya disusun sendiri oleh professor, pembahas, editor, dan butir guru dengan sedikit atau tanpa tes. bantuan orang lain atau tenaga ahli. 4) Menggunakan butir-butir tes yang Jarang-jarang sudah diujicobakan dianalisis, 5) dan (try direvisi menggunakan out), butir-butir tes yang sudah sebelum diujicobakan, dianalisis, dan menjadi sebuah tes. direvisi. Mempunyai reliabilitas yang tinggi. Mempunyai reliabilitas sedang atau rendah. 6) Dimungkinkan menggunakan norma Norma untuk seluruh negara. kelompok terbatas kelas tertentu. Sumber : Arikunto (2009: 146-147) Sesuai dengan perbandingan di atas disimpulkan bahwa tes standar digunakan untuk membandingkan tingkat prestasi siswa di berbagai bidang studi yang mencakup seluruh sekolah atau kelas. Sedangkan tes buatan guru digunakan untuk mengetahui seberapa baik siswa telah menguasai bahan pelajaran yang dilihat berdasarkan hasil yang diperoleh selama satu periode tertentu. 5 Sejalan dengan pendapat di atas Margono (2005: 170) menambahkan bahwa: “Jika dilihat dari tingkatannya tes dapat diklasifikasikan menjadi dua yaitu tes baku dan tes buatan peneliti sendiri”. Tes baku adalah tes yang dipublikasikan dan telah disiapkan oleh para ahli secara cermat sehingga norma-norma perbandingan, validitas, reliabilitas dan petunjuk pemberian skornya telah diuji dan disiapkan. Tes buatan sendiri, agar dapat dipergunakan sebagai alat pengukuran perlu diperhatikan beberapa hal berikut ini: 1. Tes harus valid, tes disebut valid apabila tes tersebut benar-benar dapat mengungkap aspek yang diselidiki secara tepat, dengan kata lain harus memiliki tingkat ketepatan yang tinggi dalam mengungkap aspek-aspek yang hendak diukur. 2. Tes harus reliabel, tes dikatakan reliabel apabila tes tersebut mampu memberikan hasil yang relatif tetap apabila dilakukan secara berulang pada kelompok individu yang sama. Dengan kata lain tes itu memiliki tingkat ketepatan atau tingkat ketetapan yang tinggi dalam mengungkap aspek-aspek yang hendak diukur. 3. Tes harus obyektif, tes dikatakan obyektif apabila dalam memberikan nilai kuantitatif terhadap jawaban, unsur subyektivitas penilai tidak ikut mempengaruhi. 4. Tes harus bersifat diagnostik, tes bersifat diagnostik apabila tes memiliki daya pembeda dalam arti mampu memilah-milah individu yang memiliki kemampuan yang tinggi sampai dengan angka yang terendah dalam aspek 6 yang akan diungkap. Untuk itu harus dilakukan perhitungan tingkat kesukaran butir tes dan analisis butir tes. Keadaan ini harus tersebar sedemikian rupa di dalam tes. Penyebarannya disarankan sebagai berikut: 20% butir tes yang sukar, 50% butir tes yang kesukarannya yang sedang, dan 30% butir tes yang mudah. 5. Tes harus efisien, tes yang efisien yaitu tes yang mudah cara membuatnya dan mudah pula penilaiannya. 2.2.2 Tes Obyektif Menurut Taruh (2008: 3) mengemukakan bahwa: “Tes dapat dipilah ke dalam berbagai kelompok”. Bila ditinjau dari segi bentuknya, secara umum ada dua bentuk tes yaitu butir tes bentuk uraian (essay test) dan tes obyektif (obyektive test). Bentuk butir tes uraian atau soal bentuk uraian adalah suatu soal yang jawabannya menuntut siswa untuk mengingat dan mengorganisasikan gagasangagasan tersebut dalam bentuk uraian tertulis. Sedangkan soal bentuk obyektif adalah suatu soal yang mengandung kemungkinan jawabannya harus dipilih atau dikerjakan oleh peserta tes. Butir tes obyektif menurut tipenya dapat dibagi menjadi tiga, yaitu tes benar-salah (true-false), butir tes menjodohkan (matching), dan butir tes pilihan ganda (multiple choice). 7 Soal bentuk pilihan ganda memiliki beberapa kelebihan, diantaranya: a) Mampu mengukur berbagai tingkatan kognitif (dari ingatan sampai dengan evaluasi). b) Penskorannya mudah, cepat, objektif dan dapat mencakup ruang lingkup bahasa atau materi yang luas dalam suatu tes untuk suatu kelas atau jenjang pendidikan. c) Lebih tepat untuk ujian yang pesertanya sangat banyak atau massal, tetapi hasilnya harus segera diumumkan, seperti ulangan akhir semester, ulangan kenaikan kelas dan ujian akhir sekolah. Namun demikian, bentuk ini juga memiliki beberapa keterbatasan, antara lain: a. Memerlukan waktu yang relatif lama untuk menulis soalnya, b. Sulit membuat pengecoh yang homogen dan berfungsi dengan baik, dan c. Terdapat peluang untuk menebak jawaban. 2.3 Syarat-syarat Tes Yang Baik Suatu tes dikatakan baik apabila memenuhi kriteria-kriteria tertentu sebagai syarat dalam hal kesesuaian, efisiensi, dan kemantapan suatu tes. Selain itu, tes yang baik dapat menghasilkan butir tes yang bermutu, sebab butir tes yang bermutu dapat membantu guru dalam upaya meningkatkan kualitas pembelajaran. Butir tes yang bermutu juga dapat memberikan informasi dengan tepat tentang siswa mana yang belum atau sudah mencapai kompetensi yang ditetapkan. 8 Wainer dan Braun dalam Kusaeri (2012: 74) menyatakan bahwa: “Tes yang baik harus memenuhi tiga karakteristik, yaitu: validitas, reliabilitas dan usabilitas”. Sedangkan menurut Taruh (2008: 3) mengemukakan bahwa: “Syarat-syarat tes yang baik antara lain : a) syarat pertama, adalah setiap alat ukur hanya mengukur satu dimensi atau satu aspek saja, dengan demikian hal ini berkaitan dengan validitas, yang berarti sejauh mana ketepatan atau kecermatan suatu alat ukur dalam melaksanakan fungsi ukurnya, b) syarat kedua, adalah kehandalan (reliabilitas) dari alat ukur, kehandalan berarti sejauh mana hasil suatu pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama (konsisten), selama aspek yang diukur dalam diri subyek memang belum berubah”. Dalam hal ini Kusaeri (2012: 73) menambahkan kualitas sebuah tes tergantung pada seberapa tepat dan akurat hasil ukurannya, seberapa handal kemampuan tes dalam mengukur dan seberapa praktis tes tersebut dapat digunakan. Tingkat akurasi hasil pengukuran disebut sebagai validitas tes, tingkat keajegan atau konsistensi disebut sebagai reliabilitas, serta tingkat kemudahan dan kepraktisan sebuah tes dalam penggunannya disebut sebagai usabilitas. Sedangkan menurut Arikunto (2009: 170) menyatakan: “Sebuah tes dapat dikatakan baik sebagai alat pengukur harus memenuhi persyaratan tes, yakni (1) validitas tes (test validity), (2) reliabilitas tes (test reliability) (3) taraf kesukaran (difficulty index), (4) daya pembeda (discriminating power), dan (5) Pengecoh (distractor)”. Dengan demkian dapat disimpulkan bahwa kriteria tes yang baik harus memenuhi kriteria, yakni dari segi validitas, reliabilitas, tingkat kesukaran, daya pembeda, dan pengecoh yang bersifat obyektif, praktis serta ekonomis”. 9 2.3.1 Tingkat Kesukaran Kusaeri, (2012: 174) mengemukakan bahwa: “Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks”. Lebih lanjut Arikunto (2009: 197) mengemukakan bahwa: “Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi memecahkannya, sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya”. Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal tersebut baik atau tidak baik. Tingkat kesukaran butir soal hanya menunjukkan butir soal tersebut sukar atau mudah untuk kelompok peserta tes tertentu. Butir soal hasil belajar yang terlalu sukar atau terlalu mudah tidak banyak memberikan informasi tentang butir soal atau kemampuan peserta tes. Oleh karena itu untuk menyusun naskah ujian sebaiknya digunakan butir soal yang tingkat kesukarannya berimbang yaitu 25% mudah, 50% sedang, dan 25% sukar (Taruh, 2008: 14). Menurut Arikunto (2009: 208) untuk menghitung tingkat kesukaran butir soal digunakan rumus berikut: ……………………………………………………(1) 10 Keterangan: p = Tingkat kesukaran B = Jumlah siswa yang menjawab benar butir soal Js = Jumlah siswa yang mengikuti tes Dari rumus di atas dapat diketahui bahwa tingkat kesukaran butir soal sangat dipengaruhi oleh tingkat kemampuan anggota kelompok pada tes. Tingkat kesukaran berada pada interval 0,0 sampai 1. Semakin tinggi tingkat kesukaran soal berarti semakin mudah soal tersebut dan sebaliknya semakin rendah tingkat kesukaran soal berarti semakin sukar soal tersebut (Taruh, 2008: 13). Klasifikasi tingkat kesukaran soal menurut Taruh (2008: 14) dapat menggunakan kriteria berikut: 0,76 – 1,00 : Mudah 0,26 – 0,75 : Sedang 0,0 – 0,25 : Sukar atau Sulit 2.3.2 Validitas Tes Menurut Arikunto (2010: 210) mendefinisikan bahwa: “Validitas adalah suatu ukuran yang menunjukkan tingkat-tingkat kevalidan atau kesahihan suatu instrumen”. Suatu instrumen yang valid atau sahih mempunyai validitas yang tinggi, sebaliknya instrumen yang kurang valid berarti memiliki validitas rendah. Lebih lanjut Sukaeri (2012: 75) mengemukakan bahwa: “Validitas tes sering diartikan sebagai sebuah tes yang mampu megukur apa yang hendak diukur”. Menurut Sukardi (2009: 122) menambahkan bahwa: 11 “Validitas suatu tes dapat dibedakan menjadi empat macam, yaitu: (1) validitas isi, ialah derajat dimana sebuah tes mengukur cakupan substansi yang ingin diukur, (2) validitas konstruk, merupakan derajat yang menunjukan suatu tes mengukur sebuah konstruk sementara atau hypotetical construct, (3) validitas konkuren adalah derajat dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat, dan (4) validitas prediksi, adalah derajat yang menunjukkan suatu tes dapat memprediksi tentang bagaimana seseorang akan melakukan suatu prospek tugas atau pekerjaan yang direncanakan”. Menurut Taruh (2008: 18) menambahkan bahwa: “Jika skor butir dikotomi, (misalnya 0,1) maka untuk menghitung koefisien korelasi antara skor butir dengan skor total instrumen digunakan koefisien korelasi Point Biserial berikut: rbis (i ) Xi Xt pi St qi ………………………………………………(2) Keterangan: rbis (i ) = Koefisien korelasi biserial antara skor butir nomor i dengan skor total Xi = Rata-rata skor total responden yang menjawab benar butir soal nomor i Xt = Rata-rata skor total semua responden St = Standar deviasi skor total semua responden pi = Proporsi jawaban yang benar untuk butir soal nomor i qi = Proporsi jawaban yang benar untuk butir soal nomor i Nilai koefisien korelasi yang didapat untuk masing-masing butir, baik butir yang mempunyai skor kontinum maupun butir yang mempunyai skor dikotomi dibandingkan dengan nilai koefisien korelasi yang ada di tabel r pada alpha teretentu, misalnya 0,05 . Jika koefisien korelasi skor butir dengan skor 12 total lebih besar atau sama dengan koefisien korelasi dari tabel r, koefisien korelasi butir signifikan dan butir tersebut dianggap valid secara empiris. Sehingga, Suatu tes dikatakan valid apabila rhitung ≥ rtabel, sehingga suatu instrumen memiliki validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang tepat dan akurat sesuai dengan maksud dikenakannya pengukuran tersebut. 2.3.3 Reliabilitas Tes Kriteria lainnya yang penting lainnya adalah reliabilitas. Menurut Taruh (2008: 3) bahwa: “Reliabilitas ialah kehandalan dari alat ukur, kehandalan berarti sejauhmana hasil suatu pengukuran dapat dipercaya”. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama (konsisten), selama aspek yang diukur dalam diri subyek memang belum berubah. Sedangkan Kusaeri (2012: 82) menyatakan bahwa: “Reliabilitas merujuk pada konsistensi dari suatu pengukuran, artinya bagaimana skor tes konsisten dari pengukuran yang satu ke lainnya”. Lebih lanjut Sukardi (2009: 127) mengungkapkan bahwa: “Suatu tes dikatakan memiliki reabilitas tinggi, apabila tes yang dibuat mempunyai hasil yang konsisten dalam mengukur yang hendak diukur”. Ini berarti semakin reliabel suatu tes memiliki persyaratan maka semakin yakin kita dapat menyatakan bahwa dalam hasil suatu tes mempunyai hasil yang sama ketika dilakukan tes kembali. 13 Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan (precision) dan keajegan (consistency) skor tes. Indeks reliabilitas berkisar antara 0-1, semakin tinggi koefisien reliabilitas suatu tes (mendekati 1), semakin tinggi pula keajegan atau ketepatannya (Kementerian pendidikan nasional, 2008: 17). Pengukuran reliabilitas digunakan untuk mengetahui keajegan tes yang akan digunakan. Untuk keperluan pengukuran tersebut ada beberapa alternatif teknik pengukuran yang dapat dimanfaatkan, yaitu tes ulang, tes paralel, tes satu kali, dan tes belah dua. Dari alternatif yang dikemukakan di atas, penelitian ini teknik pelaksanaannya hanya satu kali tes. Harga koefisien reliabilitasnya dihitung dengan menggunakan rumus Kuder-Richardson (KR-20) berikut ini: k pi qi rii 1 St 2 k 1 …………………………………………(3) Dengan menggunakan rumus ini hasilnya lebih teliti dibandingkan dengan yang lain. Rumus (KR20) dapat dituliskan keterangannya seperti berikut ini: rii = Koefisien reliabilitas tes k = Cacah butir pi = Proporsi jawaban yang benar untuk butir nomor i qi = Proporsi jawaban yang salah untuk butir nomor i St 2 = Varians skor total 14 Koefisien reliabilitas tes (r11) pada umumnya digunakan patokan seperti yang dikemukakan oleh Priatna (dalam Guilford, 2008: 16) adalah sebagai berikut: 0,81 - 1,00 : reliabilitas sangat tinggi 0,61 - 0,80 : reliabilitas tinggi 0,41 - 0,60 : reliabilitas sedang 0,21 - 0,40 : reliabilitas rendah -1,0 - 0,20 : reliabilitas tidak berarti Dari pendapat-pendapat di atas dapat dikatakan bahwa reliabilitas suatu tes menunjukkan adanya ketetapan atau konsistensi, ketepatan, dan produktivitas dari instrumen tes tersebut. 15 2.3.4 Daya Pembeda Menurut Sukaeri (2012: 175) mengemukakan bahwa: “Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara siswa yang telah menguasai materi yang ditanyakan dan siswa yang belum menguasai materi yang diujikan”. Daya beda soal adalah tingkat kemampuan butir soal yang membedakan antara kelompok siswa berprestasi tinggi (kelompok atas) dengan kelompok yang berprestasi rendah (kelompok bawah). Dengan kata lain, daya beda soal adalah kemampuan soal untuk membedakan siswa yang menguasai dengan yang tidak/belum menguasai materi bidang studi yang dinyatakan dalam soal tersebut. Daya beda soal berada pada interval -0,1 sampai dengan 1,0. Semakin tinggi daya beda soal semakin kuat soal itu membedakan kelompok atas dan kelompok bawah, dengan demikian soal tersebut semakin baik mutunya dan sebaliknya semakin rendah daya beda soal berarti semakin lemah soal itu untuk membedakan kelompok atas dan kelompok bawah. Jika daya beda bernilai negatif (<0), maka hal ini berarti lebih banyak kelompok bawah yang menjawab benar soal tersebut dibanding dengan kelompok atas, dengan demikian soal tersebut dianggap jelek (Kusaeri, 2012: 177). Menurut Taruh (2008: 13) mengemukakan bahwa: “Untuk menentukan jumlah sampel yang akan digunakan dalam menghitung daya beda butir soal yaitu jika jumlah mahasiswa besar (40 orang atau lebih) maka perlu dibuat pembagian 3 kelompok, yaitu kelompok atas, kelompok tengah dan kelompok bawah untuk memudahkan analisis. Kelompok atas dan kelompok bawah masingmasing 27% dari jumlah tersebut, kelompok tengah tidak diikut sertakan dalam analisis butir”. Sedangkan menurut Sudjana (2010: 141) mengemukakan bahwa: “Untuk menentukan jumlah sampel yang akan digunakan dalam menghitung daya beda butir soal yaitu dengan mengambil 27% dari kelompok tinggi dan 27% dari kelompok rendah”. 16 Dengan demikian daya pembeda soal tes merupakan kemampuan soal tes untuk membedakan antara siswa yang termasuk dalam kategori atas atau pandai dengan yang termasuk kategori bawah atau kurang menguasai materi. Menurut Arikunto (2009: 213) untuk menghitung koefisien reliabilitas digunakan rumus berikut: D BA BB PA PB ……………………………………………(4) J A JB Keterangan: JA = banyaknya peserta kelompok atas JB = banyaknya peserta kelompok bawah BA = banyaknya peserta kelompok atas yang menjawab soal dengan benar BB = banyaknya peserta kelompok bawah yang menjawab soal dengan benar Adapun kriteria menurut Cracker and algina dalam Taruh (2008: 15) adalah sebagai berikut : 0,40 ke atas : butir soal sangat baik 0,30 - 0,39 : butir soal baik 0,20 - 0,29 : butir soal cukup baik, pengecoh perlu diperbaiki 0,19 ke bawah : butir soal jelek dan disarankan direvisi 2.3.5 Pengecoh (distractor) Menurut Kusaeri (2012: 107) mengemukakan bahwa: “Pengecoh adalah jawaban yang tida benar atau kurang tepat, namun memungkinkan seseorang terkecoh untuk memilihnya apabila ia tidak menguasai materi dengan baik”. Jawaban pengecoh yang terdapat pada soal-soal obyektif atau pilihan ganda yang digunakan untuk mengecoh siswa sebagai peserta tes. Oleh karena itu jawaban pengecoh harus diformulasikan sedemikian rupa agar berfungsi dengan baik dan tepat sasaran. 17 Dalam hal ini Arikunto (2009: 170) mengatakan bahwa: “Distraktor (pengecoh) dapat dikatakan berfungsi dengan baik apabilak distraktor tersebut mempunyai daya tarik yang besar bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang menguasai bahan”. Untuk berfungsi tidaknya pilihan jawaban (pengecoh), diadakan analisis butir dengan melihat distribusi jawaban. Suatu pilihan jawaban dapat dikatakan berfungsi apabila: 1) Paling tidak dipilih oleh 2.5% peserta tes, 2) Pengecoh lebih banyak dipilih oleh kelompok bawah (Taruh, 2008: 16). Oleh karena itu, guru sebagai pembuat tes perlu mengadakan perbaikan soal apabila distraktornya kurang baik, atau bahkan menggantinya apabila distraktornya tidak baik. 2.4 Analisis Butir Soal Menurut Aiken (dalam Sukaeri, 2012: 163) menyatakan bahwa: “Kegiatan analisis butir soal merupakan kegiatan penting dalam penyusunan butir soal yang bermutu”. Sedangkan menurut Sudjana (2009: 135) mengemukakan bahwa “Analisis soal adalah pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai“. Dari pengertian di atas dapat disimpulkan bahwa kegiatan analisis butir tes merupakan upaya menyeleksi butir-butir tes yang diujicobakan untuk mendapatkan butir soal yang baik. 2.4.1 Tujuan Analisis Butir Soal Menurut Sukaeri (2012: 163) mengemukakan bahwa: “Tujuan kegiatan analisis butir soal antara lain: 1) mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan, 2) meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif, serta 3) mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah diajarkan”. 18 Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai materi. Menurut Anastasi (dalam Kusaeri, 2012: 163), analisis butir soal dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan dengan ciriciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan konstruk, sedangkan analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir soal, kesulitan butir soal serta diskriminasi soal. 2.4.2 Manfaat kegiatan analisis butir soal Menurut Sukaeri (2012: 164) kegiatan analisis butir soal memiliki banyak manfaat, diantaranya: 1. Dapat membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan. 2. Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa di kelas. 3. Mendukung penulisan butir soal yang efektif. 4. Secara materi dapat memperbaiki pembelajaran di kelas 5. Meningkatkan validitas soal dan reliabilitas serta menguraikan manfaat kegiatan analisis butir soal. Linn (dalam Sukaeri, 2012: 164) menambahkan bahwa: “Pelaksanaan kegiatan analisis butir soal, biasanya didesain untuk menjawab pertanyaan-pertanyaan berikut: 1) apakah fungsi soal sudah tepat? 2) apakah soal telah memiliki tingkat kesukaran yang tepat? 3) apakah soal bebas dari hal-hal yang tidak relevan? 3) apakah pilihan jawabannya efektif? selain itu, data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk: 1) diskusi tentang efisien hasil tes, 2) kerja remedial, 3) peningkatan secara umum pembelajaran di kelas, dan 4) peningkatan keterampilan pada konstruksi tes”. Berbagai uraian di atas, menunjukkan bahwa analisis butir soal memberikan manfaat: 1) menentukan soal-soal yang cacat atau tidak berfungsi dengan baik, 2) meningkatkan butir 19 soal melalui tiga komponen analisis yaitu tingkat kesukaran, daya pembeda dan pengecoh soal, 3) merevisi soal yang tidak relevan dengan materi yang diajarkan, ditandai dengan banyaknya anak yang tidak dapat menjawab butir soal tertentu. 20