Kegiatan
menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru
untuk meningkatkan mutu soal yang telah ditulis. Kegiatan ini merupakan proses
pengumpulan, peringkasan, dan penggunaan informasi dari jawaban siswa untuk
membuat keputusan tentang setiap penilaian (Nitko, 1996: 308). Tujuan
penelaahan adalah untuk mengkaji dan menelaah setiap butir soal agar diperoleh
soal yang bermutu sebelum soal digunakan. Di samping itu, tujuan analisis butir
soal juga untuk membantu meningkatkan tes melalui revisi atau membuang soal
yang tidak efektif, serta untuk mengetahui informasi embertic pada siswa apakah
mereka sudah/belum memahami materi yang telah diajarkan (Aiken, 1994: 63). Soal
yang bermutu adalah soal yang dapat memberikan informasi setepat – tepatnya
sesuai dengan tujuannya di antaranya dapat menentukan peserta didik mana yang
sudah atau belum menguasai materi yang diajarkan guru.
Tujuan
utama analisis butir soal dalam sebuah tes yang dibuat guru adalah untuk
mengidentifikasi kekurangan – kekurangan dalam tes atau dalam pembelajaran
(Anastasi dan Urbina, 1997:184). Berdasarkan tujuan ini, maka kegiatan analisis
butir soal memiliki banyak manfaat, di antaranya adalah: (1) dapat membantu
para pengguna tes dalam evaluasi atas tes yang digunakan, (2) sangat relevan
bagi penyusunan tes informal dan embe seperti tes yang disiapkan guru untuk
siswa di kelas, (3) mendukung penulisan butir soal yang efektif, (4) secara
materi dapat memperbaiki tes di kelas, (5) meningkatkan validitas soal dan
reliabilitas (Anastasi and Urbina, 1997:172).
Disamping
itu manfaat lainnya adalah: (1) menentukan apakah suatu fungsi butir soal
sesuai dengan yang diharapkan, (2) ember masukan kepada siswa tentang kemampuan
dan sebagai dasar untuk bahan diskusi di kelas, (3) ember masukan kepada guru
tentang kesulitan siswa, (4) ember masukan pada aspek tertentu untuk
pengembangan kurikulum, (5) merevisi materi yang dinilai atau diukur, (6)
meningkatkan keterampilan penulisan soal (Nitko, 1996: 308-309).
Linn dan Gronlund (1995: 315) juga menambahkan
tentang pelaksanaan kegiatan analisis butir soal yang biasanya didesain untuk
menjawab pertanyaan – pertanyaan berikut ini. (1) Apakah fungsi soal sudah
tepat? (2) Apakah soal ini memiliki tingkat kesukaran yang tepat? (3) Apakah
soal bebas dari hal-hal yang tidak relevan? (4) Apakah pilihan jawabannya
efektif? Lebih lanjut Linn dan Gronlund (1995: 3 16-318) menyatakan bahwa
kegunaan analisis butir soal bukan hanya terbatas untuk peningkatkan butir
soal, tetapi ada beberapa hal, yaitu bahwa data analisis butir soal bermanfaat
sebagai dasar: (1) diskusi kelas efisien tentang hasil tes, (2) untuk kerja
remedial, (3) untuk peningkatan secara umum pembelajaran di kelas, dan (3)
untuk peningkatan keterampilan pada konstruksi tes. Berbagai uraian di atas
menunjukkan bahwa analisis butir soal adalah: (1) untuk menentukan soal – soal
yang cacat atau tidak berfungsi penggunaannya; (2) untuk meningkatkan butir
soal melalui tiga komponen analisis yaitu tingkat kesukaran, daya pembeda, dan
pengecoh soal, serta meningkatkan pembelajaran melalui ambiguitas soal dan
keterampilan tertentu yang menyebabkan peserta didik sulit. Di samping itu,
butir soal yang telah dianalisis dapat memberikan informasi kepada peserta
didik dan guru.
Dari latar belakang masalah di atas,
dapat dirumuskan beberapa masalah yang akan dibahas:
1.
Bagaimana
menganalisis butir tes?
2.
Bagaimana
menghitung indeks kesukaran butir tes?
3.
Bagaimana
menghitung indeks daya beda butir tes?
4.
Bagaimana
menganalisis keefektifan jawaban pengecoh?
Adapun tujuan
pembahasan makalah ini adalah:
1.
Untuk
mengetahui bagaimana menganalisis butir tes.
2.
Untuk
mengetahui cara menghitung indeks kesukaran butir tes.
3.
Untuk
mengetahui cara menghitung indeks daya beda butir tes.
4.
Untuk
mengetahui bagaimana menganalisis keefektifan jawaban pengecoh.
Adapun manfaat yang dapat diambil
dari pembahasan makalah ini adalah menambah wawasan pengetahuan tentang
bagaimana cara menganalisis butir tes.
1.
Menganalisis Butir Tes
Dalam
menganalisis butir tes akan dilihat karakteristiknya dan dipilih butir - butir
yang baik. Butir yang baik adalah butir - butir yang karakteristiknya memenuhi syarat sebagaimana kriteria karakteristik butir yang baik. Adapun cara
untuk memperbaiki proses belajar - mengajar yang paling efektif ialah dengan
jalan mengevaluasi tes hasil belajar yang diperoleh dari proses belajar -
mengajar itu sendiri. Dengan kata lain, hasil tes itu diolah sedemikian rupa
sehingga dari hasil pengolahan itu dapat diketahui komponen - komponen manakah
dari proses - mengajar itu yang masih lemah.
Pengolahan tes
hasil belajar dalam rangka memperoleh proses belajar mengajar dapat dilakukan
dengan berbagai cara, antara lain:
1. Dengan membuat
analisis soal (item analysis)
2. Dengan
menghitung validitas dan keandalan tes
Menurut Thorndike dan Hagen (1977), analisis
terhadap soal - soal tes yang telah dijawab oleh murid- murid mempunyai dua
tujuan penting.
Pertama, jawaban -
jawaban soal itu merupakan informasi diagnostik untuk meneliti pelajaran dari
kelas itu dan kegagalan - kegagalan belajar, serta selanjutnya untuk membimbing
ke arah cara yang lebih baik.
Kedua, jawaban -
jawaban terhadap soal yang terpisah dan perbaikan (review) soal - soal yang
didasarkan atas jawaban - jawaban itu merupakan basis bagi persiapan tes - tes
yang lebih baik untuk tahun berikutnya.
Jadi tujuan khusus dari items analisis ialah
mencari soal tes mana yang baik dan mana yang tidak baik, dengan membuat
analisis soal, sedikitnya dapat mengetahui dari tiga segi yang dapat diperoleh dari tiap soal, yaitu:
a.
Dari segi
derajat kesukaran itemnya
b.
Dari segi daya
pembeda itemnya
c.
Dari segi
fungsi distraktornya.
2. Menghitung Indeks Kesukaran Butir Tes
Analisis
tingkat kesukaran dimaksudkan untuk mengetahui apakah soal tersebut tergolong
mudah atau sukar. Tingkat kesukaran adalah bilangan yang menunjukan sukar atau
mudahnya sesuatu soal. (Arikunto, 1999: 207). Tingkat kesukaran, disimbolkan
dengan p , merupakan salah satu parameter butir soal yang sangat berguna dalam
analisis soal. Tingkat kesukaran dapat dihitung dengan berbagai cara, yaitu (a)
skala kesukaran linear, (b) skala bivariat, (c) indeks Davis, dan (d) proporsi
menjawab benar (Bahrul Hayat, dkk., 1999). Secara matematis tingkat kesukaran
yang dihitung dengan proporsi menjawab benar dirumuskan dengan:
Dengan
keterangan B adalah banyak peserta tes yang menjawa benar, dan N jumlah peserta
tes yang menjawab. Dengan rumus tersebut, maka dapat diketahui bahwa jika p
mendekati 0, maka soal tersebut terlalu sukar, sedang jika p mendekati 1 maka
soal tersebut terlalu mudah. Soal yang terlalu mudah atau erlalu sukar tidak dapat membedakan kemampuan
peserta tes sehingga perlu dibuang.
Menurut
Allen dan Yen (1979) tingkat kesukaran butir soal sebaiknya antara 0,3 - 0,7.
Pada rentang tersebut informasi tentang kemampuan siswa akan diperoleh secara
maksimal. Namun angka tersebut perlu disesuaikan dengan tujuan pengembangan
soal. Soal untuk keperluan seleksi, remidi, atau ulangan umum seharusnya
mempunyai p yang berbeda-beda untuk mencapai tujuan yang maksimal. Indeks
klasifikasi indeks kesukaran seperti dibawah ini:
Sedangkan rumus
untuk tes uraian:
Tk : Indeks tingkat kesukaran butir soal
SA : jumlah skor kelompok
atas
SB : jumlah skor kelompok bawah
IA : jumlah skor ideal kelompok atas
IB : jumlah skor ideal kelompok bawah
Interpretasi
Tingkat Kesukaran:
Daya
beda merupakan parameter butir soal yang memberikan informasi tentang seberapa
besar butir soal tersebut dapat membedakan peserta tes yang skornya tinggi dan
peserta tes yang skornya rendah. Daya beda dapat dihitung dengan beberapa cara
antara lain dengan menghitung koefisien korelasi point biserial dan
koefisien korelasi biserial. Korelasi point biserial secara
matematis dirumuskan sebagai berikut.
Hubungan antara
korelasi point biserial dengan korelasi biserial mengikuti rumus sbb:
Dengan keterangan
rbis adalah koefisien korelasi biserial, y adalah ordinat p dalam distribusi
normal, sedangkan simbol lain sama dengan keterangan sebelumnya. Nilai korelasi
point biserial selalu lebih rendah dibanding dengan nilai korelasi biserial.
4.
Menganalisis Keefektifan Jawaban Pengecoh
Setiap
tes pilihan ganda memiliki satu pertanyaan serta beberapa pilihan jawaban.
Diantara pilihan jawaban yang ada, hanya satu yang benar. Selain jawaban yang
benar tersebut, adalah jawaban yang salah. Jawaban yang salah itulah yang
dikenal dengan distractor (pengecoh). Dengan demikian, efektifitas distraktor
adalah seberapa baik pilihan yang salah tersebut dapat mengecoh peserta tes
yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin banyak
peserta tes yang memilih distraktor tersebut, maka distaktor itu dapat
menjalankan fungsinya dengan baik.
Cara menganalisis fungsi distraktor dapat dilakukan dengan
menganalisis pola penyebaran jawaban butir. Pola penyebaran jawaban sebagaimana
dikatakan Sudijono (2005: 411) adalah suatu pola yang dapat menggambarkan
bagaimana peserta tes dapat menentukan pilihan jawabannya terhadap
kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir.
Menurut Depdikbud (1993: 27) sebuah distraktor dapat dikatakan berfungsi dengan
baik jika dipilih oleh paling sedikit 5% untuk 4 pilihan jawaban dan 3% untuk 5
pilihan jawaban. Sedangkan menurut Fernandes (1984: 29) distraktor dikatakan
baik jika dipilih oleh minimal 2% dari seluruh peserta. Distraktor yang tidak
memenuhi kriteria tersebut sebaiknya diganti dengan distraktor lain yang
mungkin lebih menarik minat peserta tes untuk memilihnya.
Dalam setiap tes obyektif selalu digunakan
alternative jawaban yang mengandung dua unsur sekaligus yaitu jawaban
yang tepat dan jawaban yang salah sebagai penyesat/ pengecoh (distraktor). Tujuan pemakaian
distraktor sebagai pengecoh bagi yang kurang mampu untuk dapat dibedakan dengan
yang mampu.
No. item
(kunci)
|
Klp
27%
|
Key /
Distraktor
|
WL
WH
|
TK
|
DP
|
A
|
B
|
C
|
D
|
E
|
O
|
I
(A)
|
L
|
10
|
7
|
5
|
10
|
3
|
-
|
25
|
57
|
0,28
|
H
|
20
|
3
|
6
|
5
|
1
|
-
|
15
|
2
(B)
|
L
|
7
|
19
|
4
|
0
|
5
|
-
|
35
|
95,7
|
0,08
|
H
|
17
|
7
|
6
|
3
|
2
|
-
|
32
|
3
(A)
|
L
|
9
|
12
|
9
|
3
|
2
|
-
|
14
|
62,8
|
-0,4
|
H
|
0
|
5
|
20
|
5
|
5
|
-
|
30
|
Tabel diatas menunjukkan
pemakaian distraktor yang kurang baik, sebab distraktor yang baik adalah yang
dapat dihindari oleh anak-anak yang pandai dan terpilih oleh anak-anak yang
kurang pandai.
Dari tabel analisis diatas
ada beberapa yang dapat diketahui yaitu:
- Pada umumnya alternatif jawaban sudah baik.
- Pada item nomor 3, secara jelas peletakan kunci jawaban menjadai
salah, sebab DP-nya menunjukkan angka negatif.
- Alternatif jawaban A dan C perlu dikaji kembali.
Distraktor yang paling
baik tidak harus terpilih oleh sedikitnya 2%.
Ket TK: tingkat yang ingin dicari
WH: jumlah siswa yang menjawab salah dari kelompok
WL: jumlah siswa yang menjawab salah dari
kelompok
DP: besarnya daya pembeda yang ingin dicari
Cara
untuk memperbaiki proses belajar - mengajar yang paling efektif ialah dengan
jalan mengevaluasi tes hasil belajar yang diperoleh dari proses belajar -
mengajar itu sendiri.
Untuk mengetahui soal tes mana yang baik dan
mana yang tidak baik, dengan membuat analisis soal, sedikitnya dapat mengetahui
dari tiga segi yang dapat diperoleh dari
tiap soal, yaitu:
d.
Dari segi
derajat kesukaran itemnya
e.
Dari segi daya
pembeda itemnya
f.
Dari segi
fungsi distraktornya.
Manfaatkanlah
makalah ini untuk menambah khazanah pengetahuan dalam kajian evaluasi
pendidikan.
DAFTAR PUSTAKA
Aiken,
Lewis R. (1994). Psychological Testing and Assessment,(Eight Edition),
Boston: Allyn and Bacon.
Anastasi.
Anne and Urbina, Susana. (1997). Psicoholological Testing. (Seventh Edition).
New Jersey: Prentice-Hall, Inc.
Linn,
Robert L. and Gronlund, Norman E. (1995). Measurement and Assessment in teaching
(Seventh Edition). Ohio: Merrill, an immprint of Prentice Hall.
Nitko,
Anthony J. (1996). Educational Assessment of Students, Second Edition.
Ohio: Merrill an imprint of Prentice Hall Englewood Cliffs.
Sudijono, Anas.
Pengantar Evaluasi Pendidikan, (Jakarta: PT. Raja Grafindo Persada)