PERENCANAAN TEST
(Mengembangkan
Bahan Ujian dan Penilaian)
Oleh
Asy'ariy
PENDAHULUAN
Menurut
Mahrens & Lehmann (1978: 5) evaluasi adalah suatu proses merencanakan,
memperoleh, dan menyediakan informasi yang sangat diperlukan untuk membuat
alternatif-alternatif keputusan. Ia adalah suatu proses dimana hasil sebuah
program diuji untuk diketahui hasilnya. Evaluasi tidak dapat dipisahkan
dengan pengukuran (measurements) dan test. Pengukuran
(measurements) adalah bagian umum yang menunjukkan ketetapan hasil atau
karakteristik dengan arti sebagai alat
penilaian (Tuckman, 1975: 12), sedangkan test adalah instrument yang digunakan
untuk mengumpulkan data seseorang yang
ditest.
Setiap
program pembelajaran diperlukan sebuah evaluasi. Evaluasi dipergunakan untuk mengumpulkan informasi menyeluruh dan
akurat mengenai perkembangan input-proses-dan output. Secara khusus evaluasi
dipergunakan untuk membuat sebuah kesimpulan terhadap pencapaian siswa dalam
suatu program tertentu. Salah satu alat evaluasi adalah penilaian atau test.
TUJUAN TEST
Test adalah suatu alat atau prosedur
sistematis untuk pengukur sebagian perilaku seseorang. Pada umumnya test berupa
sekumpulan butir soal yang dirakit menurut kriteria tertentu (Depdikbud, 1994).
Tujuan
test yang penting mengacu pada Kurikulum Berbasis Kompetensi (KBK) adalah
untuk: (a) mengetahui tingkat kemampuan peserta didik, (b) mengukur pertumbuhan
dan perkembangan peserta didik, (c) mendiagnosis kesulitan belajar pesrta
didik, (d) mengetahui hasil pengajaran, (e) mengetahui hasil belajar, (f)
mengetahui pencapaian kurikulum, (g) mendorong peserta didik belajar, dan (h)
mendorong guruagar mengajar lebih baik (K 2004: 2003).
Ditinjau dari tujuannya, ada empat
macam test yang banyak digunakan di lembaga pendidikan, yaitu: (a) test
penempatan (placement test), (b) test diagnostik, (c) test formatif, dan (d)
test sumatif (Thordike dan Hagen, 1977).
Sistem penilaian berbasis kompetensi pada umumnya menggunakan test
diagnostik, formatif, dan sumatif.
Test penempatan dilaksanakan pada awal
pelajaran dan digunakan untuk mengetahui tingkat kemampuan yang telah dimiliki
peserta didik. Test diagnostik dipergunakan untuk mengetahui kesulitan belajar
yang dihadapi siswa termasuk kesalahan pemahaman konsep. Test formatif bertujuan
untuk memperoleh masukan tentang tingkat keberhasilan pelaksanaan proses
pembelajaran. Masukan ini berguna untuk memperbaiki strategi mengajar.
Sedangkan test sumatif diberikan diakhir suatu pelajaran, atau akhir semester.
Hasilnya digunakan untuk menentukan keberhasilan peserta didik.
BENTUK TEST OTENTIK
Secara umum bentuk test dalam
pengujian dibedakan menjadi dua bagian besar, yaitu:
- Test standar atau yang distandarkan (standardized test), misalnya Ujian Akhir Nasional dan sejenisnya
- Test buatan guru (Teacher’s made test)
Test
buatan guru merupakan bagian dari kerangka dan rangkaian penilaian otentik (Authentic
Assessment) dalam K 2004 BK. Dalam Penilaian Otentik, test merupakan bagian
tak terpisahkan dari proses pembelajaran. Penilaian tersebut dapat dibagi
menjadi:
a) Test
tertulis (pen and paper test) bisa berbentuk obyektif maupun non obyektif (test
yang paling banyak digunakan dalam penilaian dan merupakan bahasan terbesar).
Implementasi test tertulis bisa dalam kerangka ulangan blok, ulangan harian,
ujian komprehensif akhir semester, dan bahkan ujian akhir sekolah/madrasah.
b) Portofolio
(hasil Kerja dalam bentuk bendel kerja) adalah test yang dilaksanakan selama
program berjalan dan merupakan test kemajuan berkelanjutan, misalnya tugas
merangkum materi, pemberian PR, hasil laporan kerja praktik, dan lain-lain
c) Product
(hasil karya) dalam bentuk pengembangan organisasi gagasan atau ide siswa,
misalnya membuat karya tulis pendek dengan menjawab apa pendapatmu tentang……?,
membuat puisi, cerpen, problem solving, dan lain sebagainya
d) Performance
(kinerja) atau sering disebut test praktik yang mengukur kinerja atau perbuatan
dari hasil pemahaman, pengetahuan, dan penerapan konsep dalam bentuk test yang
bisa diamati (misalnya: secara fisik), test praktik olah raga, memainkan alat
musik, wawancara, malafalkan ayat, praktik ibadah, dan lain sebagainya
e) Project
(penugasan) baik individu maupun berkelompok dengan ciri khas dilakukan dalam
waktu yang relatif lebih lama daripada test-test lainnya, misalnya siswa
ditugaskan melakukan pengamatan terhadap sesuatu dan melaporkan secara tertulis
hasil dari pengamatannya, siswa ditugaskan melakukan eksperimen, wawancara, dan
tugas lainnya dan kemudian melaporkan secara tertulis (atau lisan).
PEMILIHAN BENTUK TEST TERTULIS
Dalam pengujian (terutama kognitif)
dikenal dua macam bentuk test, yaitu (1) test objektif, dan (2) test Uraian
(Non Objektif)
1.
Test Objektif
Test
Objektif adalah test yang biasanya hanya mempunyai satu jawaban benar dan dapat
dinilai secara mekanis. Test obyektif biasanya mempunyai kelemahan mendasar
bahwa ia mudah di jawab. Soal-soal yang termasuk dalam kategori objektif test
antara lain: unstructured format dan completion format, True-false
(yes/no) format, multiple choice format, dan matching format, dimana jawabanya telah ditetapkan/dibakukan (fixed)
hanya dengan satu jawaban benar. Bentuk lain yang termasuk test objektif adalah
transformation, combination, edition, dan rearrangement.
Soal dengan jawaban singkat (Short-answer
items) diatas juga dipakai untuk
mengukur pengetahuan (Knowledge) dan pemahaman (Comprehension)
yang merupakan proses berpikir (Taxonomy) tingkat pertama dan kedua.
Dengan test jenis ini guru bermaksud untuk mengukur seberapa jauh pengetahuan
dan pemahaman materi ajar yang dipunyai siswa dan dipergunakan untuk menilai
perkembangan belajar siswa, mengetahui kelemahan-kelemahan dan untuk
mendapatkan masukan mengenai tujuan pembelajaran yang disusun. Pilihan jawaban
pada jenis item ini ada yang bersifat bebas (free choice). misalnya soal jenis unstructured
format dan completion format dan ditetapkan/dibakukan (fixed),
misalnya True-false (yes/no) format, multiple choice format, dan
matching format. Dalam penyusunan short-answer item, guru diasumsikan telah
melengkapi tiga langkah utama, yaitu: 1) menetapkan tujuan, 2) menempatkan
tujuan-tujuan tersebut dalam bentuk kerangka isi (content outline), dan
3) menulis item sesuai dengan tujuan yang telah ditetapkan.
Jenis-jenis short-answer items yang
disebut diatas punya beberapa kelemahan dan kelebihan, misalnya: dalam hal
kemudahan menjawab (seperti True/False test), kesulitan dalam penilaian
(unstructured format).
Khusus untuk jenis multiple choice format, ia adalah jenis
paling popular dalam test obyektif. Sebuah butir soal biasanya menawarkan 3-5
pilihan jawaban dengan satu jawaban yang benar. Meskipun karakteristik soal
yang baik cukup sulit dibuat, jenis ini memiliki beberapa kelebihan antara
lain:
1) Soal
yang tersusun dengan baik potensial untuk mengukur pemahaman dan aplikasi
2) Mudah
dianalisis dan dinilai
Namun
ada juga beberapa kelamahannya antara lain:
(1)
Peserta test bisa menjawab meskipun ia tidak mengerti
(2) Konstruk
evaluasi bisa bergeser menjadi test sikap daripada test pengetahuan.
(3) Untuk
mengetahui validitasnya maka perlu diadakan serangkaian uji coba, analisis dan
perbaikan sehingga memerlukan proses yang panjang dan rumit. Kesemuanya itu
adalah kelemahan dari Multiple choice format.
2.
Test Uraian/Non Objektif (Essay-type items)
Soal
jenis uraian (Essay-type items) adalah soal yang dipakai untuk mengukur
proses berpikir, yaitu: Application, Analysis, Synthesis, dan Evaluation.
Essay-type items memberi
kesempatan kepada peserta test untuk menyusun dan mengarang jawabannya sendiri
dalam batas-batas yang relatif lebih luas. Essay test mampu membuat peserta
test untuk menunjukkan kemampuannya dalam menerapkan pengetahuan dan
menganalisa, membuat sintesa, dan mengevaluasi
informasi yang diterima. Soal
jenis uraian, yang biasa disebut soal subjektif, adalah jenis soal yang mengharuskan
peserta test untuk memikirkan apa yang harus menjadi jawaban (apa yang harus
dikatakan) dan mengungkapkan ide (apa yang telah dipikirkan) sebaik mungkin. Essay-type
items mempunyai ciri-ciri dan mengukur proses berpikir sebagai berikut
a) Soal
yang mengukur “application” harus menunjukkan sesuatu yang kongkrit,
menuntut bahwa tindakan atau pilihan yang dibuat relevan dengan situasi supaya
sesuai dengan tugas yang diberikan. Tindakan (act) atau pilihan (choice)
yang dibuat harus berdasarkan pengetahuan yang telah diterima peserta test.
b) Soal
yang mengukur “analysis” punya syarat yang sama dengan soal
“application” yaitu adanya setting atau situasi dan respon atas perintah yang
terdapat dalam analisis butir soal biasanya menuntut siswa untuk mengidentifikasi
elemen-elemen khusus, hubungan-hubungan atau prinsip-prinsip yang bersifat
organisasional.
c) Soal
yang mengukur “synthesis” berupa items yang memberikan masalah-masalah
untuk dipecahkan oleh peserta test. Sintesis harus diukur dibawah kondisi yang
bisa memberikan pekerjaan yang kreatif.
d) Soal
yang mengukur “evaluation” berisi dua bagian, yaitu: 1) yang harus
dievaluasi dan 2) perintah untuk merespon (response instruction)
Essay-type items menghasilkan
jawaban (renspose) yang mungkin tidak bisa dibandingkan antara satu
jawaban dan lainnya. Disamping itu penilaian adalah satu permasalahan dari test
essay. Proses penilaiannya ternyata lebih sulit daripada pada membuat
soalnya. Sedangkan yang dinilai adalah apakah isi atau jawaban yang diberikan
oleh peserta test membuat penguji bisa menyimpulkan apakah siswa
berpengetahuan luas dalam bidang itu.
Karena pengetahuan merupakan pondasi bagi pemikiran dan keahlian pemecahan
masalah, maka beberapa pengetahuan dibutuhkan sebagai prasyarat untuk
memecahkan masalah. Kesulitan penilaian ini adalah salah satu
kesulitan/kelemahan dalam penerapan test essay. Kelemahan lainnya adalah
hasil test tersebut sulit dianalisis baik butir-butirnya maupun hasilnya.
Disamping dua jenis test tertulis
tersebut diatas, dalam KBK terdapat berbagai macam test yang mengukur baik
kinerja (performance) maupun sikap peserta didik, misal test petik kerja, test
portofolio, dan lain-lain yang juga termasuk test proses kemajuan berkelanjutan
(dibahas tersendiri)
LANGKAH PENGEMBANGAN TEST TERTULIS
Dalam KBK, secara ideal ada sembilan
langkah yang harus ditempuh dalam mengembangkan test hasil atau prestasi
belajar, yaitu:
- menyusun specifikasi test
- menulis soal test
- menelaah soal test
- melakukan uji coba test
- menganalisis butir soal
- memperbaiki test
- merakit test
- melaksanakan test, dan
- menafsirkan hasil test
Langkah awal dalam mengembangkan test
adalah menetapkan specifikasi test, yaitu berisi uraian yang menunjukkan
keseluruhan karakteristik yang harus dimiliki suatu test. Penyusunan
specifikasi test mencakup kegiatan: (a) menentukan tujuan test, (b) menyusun
kisi-kisi test, (c) memilih bentuk test, dan (d) menentukan panjang test. Dalam
test berbasis kompetensi dasar, ada tiga langkah dalam mengembangkan kisi-kisi
test, yaitu (a) menulis kompetensi daar, (b) menulis materi pokok, (c)
menentukan indicator, dan (d) menentukan jumlah soal.
Untuk
menghindari subjektivitas korektor, terutama untuk soal bentuk uraian, pedoman penskoran sangat diperlukan. Pedoman
penskoran ini merupakan petunjuk yang menjelaskan tentang batasan atau kata
kunci atau kata-kata kunci untuk melakukan penskoran terhadap soal bentuk
uraian, dan kriteria jawaban yang dipergunakan untuk melakukan penskoran pada
soal bentuk uraian non-objektif
1. Contoh untuk penskoran jawaban
tebakan (test objektif)
B
Skor
= ------- X 100
N
B =
banyaknya butir yang dijawab benar
N =
adalah banyaknya butir soal
2. Pedoman penskoran soal uraian objektif,
menggunakan skor per langkah atau isi jawaban yang sudah ditentukan dari skor
maksimum, contoh:
Langkah Kunci Jawaban Skor
1 Isi
balok = panjang x lebar x tinggi 1
2 = 150 cm x 80 cm x 75 cm 1
3 ……………………….. 1 4 ………………………..
1 5 = 900 liter
1
Skor
maksimum 5
Untuk
pendoman penskoran uraian non objektif, biasanya dipergunakan kriteria
jawaban dan rentang skor dari skor
maksimum.
PENUTUP
Tentu test yang baik adalah test yang
disusun dengan prosedur, aturan, dan teknis yang baku yang bisa memenuhi
standar validitas, baik validitas konstruk, isi, perwajahan, maupun
keandalannya dalam rentang waktu tertentu.
SUMBER BACAAN
Depdikbud, 1994. Penyusunan,
Penskoran dan Penggunaan Test Prestasi Belajar Bentuk Urian. Balitbang
Pendidikan dan Kebudayaan Depdikbud
Heaton,
J.B. 1974. Writing English Language Test. London: Longman
Kurikulum 2004
SMA, Pedoman Umum Pengembangan Penilaian: Dinas Pendidikan dan
Kebudayaan Provinsi Jawa Timur
Tuckman, Bruce. W.1975. Measuring
Educational Outcomes. USA: Harcourt Brace Jovanovich inc.
Weir,
Cyril J.1990. Communicative Language Testing. London: Prentice Hall.