BAB II KAJIAN TEORETIK 2.1 Tinjauan Tentang

advertisement
BAB II
KAJIAN TEORETIK
2.1 Tinjauan Tentang Kualitas
Berbicara tentang pengertian atau definisi kualitas dapat berbeda makna
bagi setiap orang, karena kualitas memiliki banyak kriteria dan sangat bergantung
pada konteksnya. Namun secara umum orang menyatakan bahwa kualitas adalah
sesuatu yang mencirikan tingkat dimana suatu produk memenuhi keinginan dan
harapan.
Menurut Kamus Besar Bahasa Indonesia (KBBI) tahun 2009 bahwa:
“Kualitas diartikan sebagai berikut:
1. Tingkat baik buruknya sesuatu atau kadar,
2. Derajat atau taraf (kepandaian, kecakapan, atau mutu)”.
Dalam kamus besar Bahasa Indonesia edisi kedua Depdikbud (2008)
diuraikan bahwa: “Kualitas sama halnya dengan sesuatu yang bermutu, baik dari
segi kuantitas atau kuantitatifnya. Selain itu juga dalam kamus besar Bahasa
Indonesia ada dua pengertian kualitas, yakni:
1. Kualitas merupakan tingkatan baik buruknya sesuatu kadar.
2. Kualitas adalah derajat atau taraf (kepandaian, kecakapan, dan sebagainya)
dari pribadinya seseorang yang tingkah lakunya dapat dijadikan teladan
dalam hidup bermasyarakat dan bernegara.
1
Ada dua segi umum tentang kualitas yaitu, kualitas rancangan dan kualitas
kecocokan. Semua barang dan jasa dihasilkan dalam berbagai tingkat kualitas.
Variansi dalam tingkat ini memang disengaja, maka dari itu istilah teknik yang
sesuai adalah kualitas rancangan. Kualitas kecocokan adalah seberapa baik produk
sesuai dengan spesifikasi dan kelonggaran yang disyaratkan oleh rancangan itu.
Kualitas kecocokan dipengaruhi oleh banyak faktor, termasuk pemilihan proses
pembuatan, latihan, dan pengawasan angkatan kerja serta jenis sistem kualitas
yang digunakan.
Dalam kenyataannya kualitas adalah konsep yang cukup sulit untuk
dipahami dan disepakati. Dewasa ini kata kualitas mempunyai beragam
interpretasi, tidak dapat didefinisikan secara tunggal dan sangat bergantung pada
konteksnya. Beberapa definisi kualitas berdasarkan konteksnya perlu dibedakan
atas dasar organisasi, kejadian, produk, pelayanan, proses, orang, hasil, kegiatan,
dan komunikasi. Lebih lanjut pengertian kualitas mencakup pengertian produk,
kualitas biaya, kualitas penyajian, kualitas keselamatan, dan kualitas normal.
Dari beberapa pengertian yang dikemukakan dapat disimpulkan bahwa
kualitas merupakan tingkat baik buruknya karakteristik produk dan jasa yang
menunjukkan kemampuannya untuk memuaskan kebutuhan yang tampak jelas
maupun tersembunyi.
2.2 Hakekat Tentang Tes
Tes merupakan alat atau prosedur yang berupa pertanyaan, perintah, dan
petunjuk yang ditujukan kepada testee untuk mengukur sesuatu dalam suasana
tertentu melalui aturan-aturan yang telah ditentukan.
2
Menurut Sudijono (dalam F.L. Goodeneough, 2008: 67) bahwa: “Tes
adalah suatu tugas atau serangkaian tugas yang diberikan kepada individu atau
sekelompok individu dengan maksud untuk membandingkan kecakapan mereka
satu dengan yang lain”.
Sedangkan Kusaeri (2012: 6) mengemukakan bahwa: “Tes merupakan alat
ukur berbentuk satu set pertanyaan untuk mengukur sampel tingkah laku dari
peserta tes”. Selanjutnya Taruh (2008: 2) mengemukakan bahwa:
“Definisi tes sebagai himpunan pertanyaan yang harus dijawab, atau tes
dapat didefinisikan sebagai suatu pertanyaan atau tugas atau seperangkat
tugas yang direncanakan untuk memperoleh informasi tentang trait atau
atribut pendidikan atau psikologik yang setiap butir pertanyaan atau tugas
tersebut mempunyai jawaban atau ketentuan yang dianggap benar”.
Dengan demikian maka setiap tes menuntut keharusan adanya respon dari
subyek (orang yang di tes) yang dapat dinyatakan sebagai suatu atribut yang
dimiliki oleh subyek yang sedang dicari informasinya.
Dalam kaitannya sebagai alat penilaian hasil belajar, tes minimal
mempunyai dua fungsi, yaitu:
1. Untuk mengukur tingkat penguasaan terhadap seperangkat materi atau tingkat
pencapaian
terhadap
seperangkat
tujuan
tertentu,
fungsi
ini
lebih
dititikberatkan untuk mengukur keberhasilan program pengajaran.
2. Untuk menentukan kedudukan atau peringkat siswa dalam kelompok tentang
penguasaan
materi
atau
pencapaian
tujuan
tertentu,
fungsi
lebih
dititikberatkan untuk mengukur keberhasilan belajar masing-masing individu
peserta tes.
3
Pengukuran hasil belajar dapat digunakan dua macam tes, yaitu tes standar
dan tes buatan guru (Arikunto, 2009: 146-147).
2.2.1 Tes Standar Dan Tes Buatan Guru
Tes standar biasanya digunakan pada banyak sekolah yang mencakup
wilayah yang luas. Dalam penyusunan tes standar ini pada umumnya oleh satu tim
ahli atau lembaga khusus. Tes ini sudah distandarisasi, artinya tes tersebut telah
mengalami proses validasi (ketepatan) dan reliabilitasi (ketetapan) untuk suatu
tujuan tertentu dan untuk sekelompok siswa tertentu (Sudjana 2009: 113).
Tes yang dipergunakan di sekolah-sekolah pada umumnya adalah tes
buatan guru sendiri. Tes ini belum distandarisasi, sebab dibuat oleh guru untuk
tujuan tertentu dan untuk siswa tertentu pula (Sudjana, 2009: 114). Tes tersebut
digunakan untuk mengetahui seberapa jauh para siswanya telah menguasai mata
pelajaran yang diberikan oleh guru, dilihat berdasarkan hasil belajar yang
diperoleh setiap siswa.
Dari kedua penjelasan di atas dapat disimpulkan bahwa terjadi
perbandingan antara tes standar dan tes buatan guru, seperti dalam Tabel 1 berikut
ini:
4
Tabel 1: Perbandingan Antara Tes Standar Dan Tes Buatan Guru
No.
1)
Tes standar
Tes buatan guru
Didasarkan atas bahan dan tujuan Didasarkan atas bahan dan
umum dari sekolah-sekolah di seluruh tujuan
negara.
khusus
yang
dirumuskan oleh guru untuk
kelasnya sendiri.
2)
Mencakup aspek
pengetahuan
yang luas dan Dapat terjadi hanya mencakup
atau
keterampilan pengetahuan
atau
dengan hanya sedikit butir tes untuk keterampilan yang sempit.
setiap keterampilan atau topik.
3)
Disusun dengan kelengkapan staf Biasanya disusun sendiri oleh
professor, pembahas, editor, dan butir guru dengan sedikit atau tanpa
tes.
bantuan orang lain atau tenaga
ahli.
4)
Menggunakan butir-butir tes yang Jarang-jarang
sudah
diujicobakan
dianalisis,
5)
dan
(try
direvisi
menggunakan
out), butir-butir tes yang sudah
sebelum diujicobakan, dianalisis, dan
menjadi sebuah tes.
direvisi.
Mempunyai reliabilitas yang tinggi.
Mempunyai
reliabilitas
sedang atau rendah.
6)
Dimungkinkan menggunakan norma Norma
untuk seluruh negara.
kelompok
terbatas
kelas tertentu.
Sumber : Arikunto (2009: 146-147)
Sesuai dengan perbandingan di atas disimpulkan bahwa tes standar
digunakan untuk membandingkan tingkat prestasi siswa di berbagai bidang studi
yang mencakup seluruh sekolah atau kelas. Sedangkan tes buatan guru digunakan
untuk mengetahui seberapa baik siswa telah menguasai bahan pelajaran yang
dilihat berdasarkan hasil yang diperoleh selama satu periode tertentu.
5
Sejalan dengan pendapat di atas Margono (2005: 170) menambahkan
bahwa: “Jika dilihat dari tingkatannya tes dapat diklasifikasikan menjadi dua yaitu
tes baku dan tes buatan peneliti sendiri”. Tes baku adalah tes yang dipublikasikan
dan telah disiapkan oleh para ahli secara cermat sehingga norma-norma
perbandingan, validitas, reliabilitas dan petunjuk pemberian skornya telah diuji
dan disiapkan.
Tes buatan sendiri, agar dapat dipergunakan sebagai alat pengukuran perlu
diperhatikan beberapa hal berikut ini:
1. Tes harus valid, tes disebut valid apabila tes tersebut benar-benar dapat
mengungkap aspek yang diselidiki secara tepat, dengan kata lain harus
memiliki tingkat ketepatan yang tinggi dalam mengungkap aspek-aspek yang
hendak diukur.
2. Tes harus reliabel, tes dikatakan reliabel apabila tes tersebut mampu
memberikan hasil yang relatif tetap apabila dilakukan secara berulang pada
kelompok individu yang sama. Dengan kata lain tes itu memiliki tingkat
ketepatan atau tingkat ketetapan yang tinggi dalam mengungkap aspek-aspek
yang hendak diukur.
3. Tes harus obyektif, tes dikatakan obyektif apabila dalam memberikan nilai
kuantitatif
terhadap jawaban, unsur subyektivitas penilai tidak ikut
mempengaruhi.
4. Tes harus bersifat diagnostik, tes bersifat diagnostik apabila tes memiliki
daya pembeda dalam arti mampu memilah-milah individu yang memiliki
kemampuan yang tinggi sampai dengan angka yang terendah dalam aspek
6
yang akan diungkap. Untuk itu harus dilakukan perhitungan tingkat
kesukaran butir tes dan analisis butir tes. Keadaan ini harus tersebar
sedemikian rupa di dalam tes. Penyebarannya disarankan sebagai berikut:
20% butir tes yang sukar, 50% butir tes yang kesukarannya yang sedang, dan
30% butir tes yang mudah.
5. Tes harus efisien, tes yang efisien yaitu tes yang mudah cara membuatnya dan
mudah pula penilaiannya.
2.2.2 Tes Obyektif
Menurut Taruh (2008: 3) mengemukakan bahwa: “Tes dapat dipilah ke
dalam berbagai kelompok”. Bila ditinjau dari segi bentuknya, secara umum ada
dua bentuk tes yaitu butir tes bentuk uraian (essay test) dan tes obyektif (obyektive
test). Bentuk butir tes uraian atau soal bentuk uraian adalah suatu soal yang
jawabannya menuntut siswa untuk mengingat dan mengorganisasikan gagasangagasan tersebut dalam bentuk uraian tertulis. Sedangkan soal bentuk obyektif
adalah suatu soal yang mengandung kemungkinan jawabannya harus dipilih atau
dikerjakan oleh peserta tes.
Butir tes obyektif menurut tipenya dapat dibagi menjadi tiga, yaitu tes
benar-salah (true-false), butir tes menjodohkan (matching), dan butir tes pilihan
ganda (multiple choice).
7
Soal bentuk pilihan ganda memiliki beberapa kelebihan, diantaranya:
a) Mampu mengukur berbagai tingkatan kognitif (dari ingatan sampai dengan
evaluasi).
b) Penskorannya mudah, cepat, objektif dan dapat mencakup ruang lingkup
bahasa atau materi yang luas dalam suatu tes untuk suatu kelas atau jenjang
pendidikan.
c) Lebih tepat untuk ujian yang pesertanya sangat banyak atau massal, tetapi
hasilnya harus segera diumumkan, seperti ulangan akhir semester, ulangan
kenaikan kelas dan ujian akhir sekolah.
Namun demikian, bentuk ini juga memiliki beberapa keterbatasan, antara
lain:
a. Memerlukan waktu yang relatif lama untuk menulis soalnya,
b. Sulit membuat pengecoh yang homogen dan berfungsi dengan baik, dan
c. Terdapat peluang untuk menebak jawaban.
2.3 Syarat-syarat Tes Yang Baik
Suatu tes dikatakan baik apabila memenuhi kriteria-kriteria tertentu
sebagai syarat dalam hal kesesuaian, efisiensi, dan kemantapan suatu tes. Selain
itu, tes yang baik dapat menghasilkan butir tes yang bermutu, sebab butir tes yang
bermutu dapat membantu guru dalam upaya meningkatkan kualitas pembelajaran.
Butir tes yang bermutu juga dapat memberikan informasi dengan tepat tentang
siswa mana yang belum atau sudah mencapai kompetensi yang ditetapkan.
8
Wainer dan Braun dalam Kusaeri (2012: 74) menyatakan bahwa: “Tes
yang baik harus memenuhi tiga karakteristik, yaitu: validitas, reliabilitas dan
usabilitas”. Sedangkan menurut Taruh (2008: 3) mengemukakan bahwa:
“Syarat-syarat tes yang baik antara lain : a) syarat pertama, adalah setiap
alat ukur hanya mengukur satu dimensi atau satu aspek saja, dengan
demikian hal ini berkaitan dengan validitas, yang berarti sejauh mana
ketepatan atau kecermatan suatu alat ukur dalam melaksanakan fungsi
ukurnya, b) syarat kedua, adalah kehandalan (reliabilitas) dari alat ukur,
kehandalan berarti sejauh mana hasil suatu pengukuran hanya dapat
dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap
kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama
(konsisten), selama aspek yang diukur dalam diri subyek memang belum
berubah”.
Dalam hal ini Kusaeri (2012: 73) menambahkan kualitas sebuah tes
tergantung pada seberapa tepat dan akurat hasil ukurannya, seberapa handal
kemampuan tes dalam mengukur dan seberapa praktis tes tersebut dapat
digunakan. Tingkat akurasi hasil pengukuran disebut sebagai validitas tes, tingkat
keajegan atau konsistensi disebut sebagai reliabilitas, serta tingkat kemudahan dan
kepraktisan sebuah tes dalam penggunannya disebut sebagai usabilitas.
Sedangkan menurut Arikunto (2009: 170) menyatakan:
“Sebuah tes dapat dikatakan baik sebagai alat pengukur harus memenuhi
persyaratan tes, yakni (1) validitas tes (test validity), (2) reliabilitas tes
(test reliability) (3) taraf kesukaran (difficulty index), (4) daya pembeda
(discriminating power), dan (5) Pengecoh (distractor)”.
Dengan demkian dapat disimpulkan bahwa kriteria tes yang baik harus
memenuhi kriteria, yakni dari segi validitas, reliabilitas, tingkat kesukaran, daya
pembeda, dan pengecoh yang bersifat obyektif, praktis serta ekonomis”.
9
2.3.1 Tingkat Kesukaran
Kusaeri, (2012: 174) mengemukakan bahwa: “Tingkat kesukaran soal
adalah peluang menjawab benar suatu soal pada tingkat kemampuan tertentu yang
biasanya dinyatakan dalam bentuk indeks”.
Lebih lanjut Arikunto (2009: 197) mengemukakan bahwa: “Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi memecahkannya,
sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa
dan tidak mempunyai semangat untuk mencoba lagi karena di luar
jangkauannya”.
Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal
tersebut baik atau tidak baik. Tingkat kesukaran butir soal hanya menunjukkan
butir soal tersebut sukar atau mudah untuk kelompok peserta tes tertentu. Butir
soal hasil belajar yang terlalu sukar atau terlalu mudah tidak banyak memberikan
informasi tentang butir soal atau kemampuan peserta tes. Oleh karena itu untuk
menyusun naskah ujian sebaiknya digunakan butir soal yang tingkat kesukarannya
berimbang yaitu 25% mudah, 50% sedang, dan 25% sukar (Taruh, 2008: 14).
Menurut Arikunto (2009: 208) untuk menghitung tingkat kesukaran butir
soal digunakan rumus berikut:
……………………………………………………(1)
10
Keterangan:
p = Tingkat kesukaran
B = Jumlah siswa yang menjawab benar butir soal
Js = Jumlah siswa yang mengikuti tes
Dari rumus di atas dapat diketahui bahwa tingkat kesukaran butir soal
sangat dipengaruhi oleh tingkat kemampuan anggota kelompok pada tes. Tingkat
kesukaran berada pada interval 0,0 sampai 1. Semakin tinggi tingkat kesukaran
soal berarti semakin mudah soal tersebut dan sebaliknya semakin rendah tingkat
kesukaran soal berarti semakin sukar soal tersebut (Taruh, 2008: 13).
Klasifikasi tingkat kesukaran soal menurut Taruh (2008: 14) dapat
menggunakan kriteria berikut:
 0,76 – 1,00
: Mudah
 0,26 – 0,75
: Sedang
 0,0 – 0,25
: Sukar atau Sulit
2.3.2 Validitas Tes
Menurut Arikunto (2010: 210) mendefinisikan bahwa: “Validitas adalah
suatu ukuran yang menunjukkan tingkat-tingkat kevalidan atau kesahihan suatu
instrumen”. Suatu instrumen yang valid atau sahih mempunyai validitas yang
tinggi, sebaliknya instrumen yang kurang valid berarti memiliki validitas rendah.
Lebih lanjut Sukaeri (2012: 75) mengemukakan bahwa: “Validitas tes
sering diartikan sebagai sebuah tes yang mampu megukur apa yang hendak
diukur”. Menurut Sukardi (2009: 122) menambahkan bahwa:
11
“Validitas suatu tes dapat dibedakan menjadi empat macam, yaitu: (1)
validitas isi, ialah derajat dimana sebuah tes mengukur cakupan substansi
yang ingin diukur, (2) validitas konstruk, merupakan derajat yang
menunjukan suatu tes mengukur sebuah konstruk sementara atau
hypotetical construct, (3) validitas konkuren adalah derajat dimana skor
dalam suatu tes dihubungkan dengan skor lain yang telah dibuat, dan (4)
validitas prediksi, adalah derajat yang menunjukkan suatu tes dapat
memprediksi tentang bagaimana seseorang akan melakukan suatu prospek
tugas atau pekerjaan yang direncanakan”.
Menurut Taruh (2008: 18) menambahkan bahwa: “Jika skor butir
dikotomi, (misalnya 0,1) maka untuk menghitung koefisien korelasi antara skor
butir dengan skor total instrumen digunakan koefisien korelasi Point Biserial
berikut:
rbis (i ) 
Xi  Xt
pi

St
qi
………………………………………………(2)
Keterangan:
rbis (i )
= Koefisien korelasi biserial antara skor butir nomor i dengan skor total
Xi
= Rata-rata skor total responden yang menjawab benar butir soal nomor i
Xt
= Rata-rata skor total semua responden
St
= Standar deviasi skor total semua responden
pi
= Proporsi jawaban yang benar untuk butir soal nomor i
qi
= Proporsi jawaban yang benar untuk butir soal nomor i
Nilai koefisien korelasi yang didapat untuk masing-masing butir, baik
butir yang mempunyai skor kontinum maupun butir yang mempunyai skor
dikotomi dibandingkan dengan nilai koefisien korelasi yang ada di tabel r pada
alpha teretentu, misalnya   0,05 . Jika koefisien korelasi skor butir dengan skor
12
total lebih besar atau sama dengan koefisien korelasi dari tabel r, koefisien
korelasi butir signifikan dan butir tersebut dianggap valid secara empiris.
Sehingga, Suatu tes dikatakan valid apabila rhitung ≥ rtabel, sehingga suatu
instrumen memiliki validitas yang tinggi apabila instrumen tersebut menjalankan
fungsi ukurnya, atau memberikan hasil ukur yang tepat dan akurat sesuai dengan
maksud dikenakannya pengukuran tersebut.
2.3.3 Reliabilitas Tes
Kriteria lainnya yang penting lainnya adalah reliabilitas. Menurut Taruh
(2008: 3) bahwa: “Reliabilitas ialah kehandalan dari alat ukur, kehandalan berarti
sejauhmana hasil suatu pengukuran dapat dipercaya”. Suatu hasil pengukuran
hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif
sama (konsisten), selama aspek yang diukur dalam diri subyek memang belum
berubah.
Sedangkan Kusaeri (2012: 82) menyatakan bahwa: “Reliabilitas merujuk
pada konsistensi dari suatu pengukuran, artinya bagaimana skor tes konsisten dari
pengukuran yang satu ke lainnya”.
Lebih lanjut Sukardi (2009: 127)
mengungkapkan bahwa: “Suatu tes
dikatakan memiliki reabilitas tinggi, apabila tes yang dibuat mempunyai hasil
yang konsisten dalam mengukur yang hendak diukur”. Ini berarti semakin reliabel
suatu tes memiliki persyaratan maka semakin yakin kita dapat menyatakan bahwa
dalam hasil suatu tes mempunyai hasil yang sama ketika dilakukan tes kembali.
13
Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui
tingkat ketepatan (precision) dan keajegan (consistency) skor tes. Indeks
reliabilitas berkisar antara 0-1, semakin tinggi koefisien reliabilitas suatu tes
(mendekati 1), semakin tinggi pula keajegan atau ketepatannya (Kementerian
pendidikan nasional, 2008: 17).
Pengukuran reliabilitas digunakan untuk mengetahui keajegan tes yang
akan digunakan. Untuk keperluan pengukuran tersebut ada beberapa alternatif
teknik pengukuran yang dapat dimanfaatkan, yaitu tes ulang, tes paralel, tes satu
kali, dan tes belah dua.
Dari alternatif yang dikemukakan di atas, penelitian ini teknik
pelaksanaannya hanya satu kali tes. Harga koefisien reliabilitasnya dihitung
dengan menggunakan rumus Kuder-Richardson (KR-20) berikut ini:
 k    pi qi
rii  
 1 
St 2
 k  1  

…………………………………………(3)

Dengan menggunakan rumus ini hasilnya lebih teliti dibandingkan dengan
yang lain. Rumus (KR20) dapat dituliskan keterangannya seperti berikut ini:
rii
= Koefisien reliabilitas tes
k
= Cacah butir
pi
= Proporsi jawaban yang benar untuk butir nomor i
qi
= Proporsi jawaban yang salah untuk butir nomor i
St 2
= Varians skor total
14
Koefisien reliabilitas tes (r11) pada umumnya digunakan patokan seperti
yang dikemukakan oleh Priatna (dalam Guilford, 2008: 16) adalah sebagai
berikut:

0,81 - 1,00
: reliabilitas sangat tinggi

0,61 - 0,80
: reliabilitas tinggi

0,41 - 0,60
: reliabilitas sedang

0,21 - 0,40
: reliabilitas rendah

-1,0 - 0,20
: reliabilitas tidak berarti
Dari pendapat-pendapat di atas dapat dikatakan bahwa reliabilitas suatu tes
menunjukkan adanya ketetapan atau konsistensi, ketepatan, dan produktivitas dari
instrumen tes tersebut.
15
2.3.4 Daya Pembeda
Menurut Sukaeri (2012: 175) mengemukakan bahwa: “Daya pembeda soal adalah
kemampuan suatu butir soal dapat membedakan antara siswa yang telah menguasai materi
yang ditanyakan dan siswa yang belum menguasai materi yang diujikan”. Daya beda soal
adalah tingkat kemampuan butir soal yang membedakan antara kelompok siswa berprestasi
tinggi (kelompok atas) dengan kelompok yang berprestasi rendah (kelompok bawah). Dengan
kata lain, daya beda soal adalah kemampuan soal untuk membedakan siswa yang menguasai
dengan yang tidak/belum menguasai materi bidang studi yang dinyatakan dalam soal
tersebut.
Daya beda soal berada pada interval -0,1 sampai dengan 1,0. Semakin tinggi daya
beda soal semakin kuat soal itu membedakan kelompok atas dan kelompok bawah, dengan
demikian soal tersebut semakin baik mutunya dan sebaliknya semakin rendah daya beda soal
berarti semakin lemah soal itu untuk membedakan kelompok atas dan kelompok bawah. Jika
daya beda bernilai negatif (<0), maka hal ini berarti lebih banyak kelompok bawah yang
menjawab benar soal tersebut dibanding dengan kelompok atas, dengan demikian soal
tersebut dianggap jelek (Kusaeri, 2012: 177).
Menurut Taruh (2008: 13) mengemukakan bahwa:
“Untuk menentukan jumlah sampel yang akan digunakan dalam menghitung daya
beda butir soal yaitu jika jumlah mahasiswa besar (40 orang atau lebih) maka perlu
dibuat pembagian 3 kelompok, yaitu kelompok atas, kelompok tengah dan kelompok
bawah untuk memudahkan analisis. Kelompok atas dan kelompok bawah masingmasing 27% dari jumlah tersebut, kelompok tengah tidak diikut sertakan dalam
analisis butir”.
Sedangkan menurut Sudjana (2010: 141) mengemukakan bahwa: “Untuk menentukan
jumlah sampel yang akan digunakan dalam menghitung daya beda butir soal yaitu dengan
mengambil 27% dari kelompok tinggi dan 27% dari kelompok rendah”.
16
Dengan demikian daya pembeda soal tes merupakan kemampuan soal tes untuk
membedakan antara siswa yang termasuk dalam kategori atas atau pandai dengan yang
termasuk kategori bawah atau kurang menguasai materi.
Menurut Arikunto (2009: 213) untuk menghitung koefisien reliabilitas digunakan
rumus berikut:
D
BA BB

 PA  PB ……………………………………………(4)
J A JB
Keterangan:
JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal dengan benar
BB = banyaknya peserta kelompok bawah yang menjawab soal dengan benar
Adapun kriteria menurut Cracker and algina dalam Taruh (2008: 15) adalah sebagai
berikut :

0,40 ke atas
: butir soal sangat baik

0,30 - 0,39
: butir soal baik

0,20 - 0,29
: butir soal cukup baik, pengecoh perlu diperbaiki

0,19 ke bawah
: butir soal jelek dan disarankan direvisi
2.3.5 Pengecoh (distractor)
Menurut Kusaeri (2012: 107) mengemukakan bahwa: “Pengecoh adalah jawaban
yang tida benar atau kurang tepat, namun memungkinkan seseorang terkecoh untuk
memilihnya apabila ia tidak menguasai materi dengan baik”. Jawaban pengecoh yang
terdapat pada soal-soal obyektif atau pilihan ganda yang digunakan untuk mengecoh siswa
sebagai peserta tes. Oleh karena itu jawaban pengecoh harus diformulasikan sedemikian rupa
agar berfungsi dengan baik dan tepat sasaran.
17
Dalam hal ini Arikunto (2009: 170) mengatakan bahwa: “Distraktor (pengecoh) dapat
dikatakan berfungsi dengan baik apabilak distraktor tersebut mempunyai daya tarik yang
besar bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang menguasai
bahan”.
Untuk berfungsi tidaknya pilihan jawaban (pengecoh), diadakan analisis butir dengan
melihat distribusi jawaban. Suatu pilihan jawaban dapat dikatakan berfungsi apabila: 1)
Paling tidak dipilih oleh 2.5% peserta tes, 2) Pengecoh lebih banyak dipilih oleh kelompok
bawah (Taruh, 2008: 16).
Oleh karena itu, guru sebagai pembuat tes perlu mengadakan perbaikan soal apabila
distraktornya kurang baik, atau bahkan menggantinya apabila distraktornya tidak baik.
2.4 Analisis Butir Soal
Menurut Aiken (dalam Sukaeri, 2012: 163) menyatakan bahwa: “Kegiatan analisis
butir soal merupakan kegiatan penting dalam penyusunan butir soal yang bermutu”.
Sedangkan menurut Sudjana (2009: 135) mengemukakan bahwa “Analisis soal adalah
pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki
kualitas yang memadai“.
Dari pengertian di atas dapat disimpulkan bahwa kegiatan analisis butir tes
merupakan upaya menyeleksi butir-butir tes yang diujicobakan untuk mendapatkan butir soal
yang baik.
2.4.1 Tujuan Analisis Butir Soal
Menurut Sukaeri (2012: 163) mengemukakan bahwa:
“Tujuan kegiatan analisis butir soal antara lain: 1) mengkaji dan menelaah setiap butir
soal agar diperoleh soal yang bermutu sebelum digunakan, 2) meningkatkan kualitas
butir tes melalui revisi atau membuang soal yang tidak efektif, serta 3) mengetahui
informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah
diajarkan”.
18
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya
tentang siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai
materi.
Menurut Anastasi (dalam Kusaeri, 2012: 163), analisis butir soal dapat dilakukan
secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan dengan ciriciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan konstruk,
sedangkan analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir soal,
kesulitan butir soal serta diskriminasi soal.
2.4.2 Manfaat kegiatan analisis butir soal
Menurut Sukaeri (2012: 164) kegiatan analisis butir soal memiliki banyak manfaat,
diantaranya:
1. Dapat membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan.
2. Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa di
kelas.
3. Mendukung penulisan butir soal yang efektif.
4. Secara materi dapat memperbaiki pembelajaran di kelas
5. Meningkatkan validitas soal dan reliabilitas serta menguraikan manfaat kegiatan analisis
butir soal.
Linn (dalam Sukaeri, 2012: 164) menambahkan bahwa:
“Pelaksanaan kegiatan analisis butir soal, biasanya didesain untuk menjawab
pertanyaan-pertanyaan berikut: 1) apakah fungsi soal sudah tepat? 2) apakah soal
telah memiliki tingkat kesukaran yang tepat? 3) apakah soal bebas dari hal-hal yang
tidak relevan? 3) apakah pilihan jawabannya efektif? selain itu, data hasil analisis
butir soal juga sangat bermanfaat sebagai dasar untuk: 1) diskusi tentang efisien hasil
tes, 2) kerja remedial, 3) peningkatan secara umum pembelajaran di kelas, dan 4)
peningkatan keterampilan pada konstruksi tes”.
Berbagai uraian di atas, menunjukkan bahwa analisis butir soal memberikan manfaat:
1) menentukan soal-soal yang cacat atau tidak berfungsi dengan baik, 2) meningkatkan butir
19
soal melalui tiga komponen analisis yaitu tingkat kesukaran, daya pembeda dan pengecoh
soal, 3) merevisi soal yang tidak relevan dengan materi yang diajarkan, ditandai dengan
banyaknya anak yang tidak dapat menjawab butir soal tertentu.
20
Download