by : Charles Sim
Validitas Tes Hasil Belajar
v Pendahuluan
Tes hasil belajar adalah alat
ukur yang digunakan untuk melakukan pengukuran guna pengumpulan data hasil
belajar. Sebagai sebuah alat ukur maka THB harus memenuhi syarat sebagai alat
ukur yang baik. Alat ukur yang baik harus memenuhi dua syarat validitas dan
realibilitas. Oleh karena itu, sebelum di gunakan untuk mengumpulkan data THB
harus terlebih dulu diuji validitas dan realibilitasnya.
Pengujian
validitas dan realibilitas dapat dilakukan dengan beberapa cara. Tulisan ini
membahas tentang pengujian validitas THB dan beberapa metode yang dapat
digunakan untuk pengujian.
v Validitas
Validitas
berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu yang
diinginkan diukur. Menurut Anastasi dan Urbin (1997: 113), validitas
berhubungan dengan apakah tes mengukur apa yang mesti diukurnya dan seberapa
baik dia melakukannya. Validitas merupakan derajad sejauh mana tes mengukur apa
yang ingin diukur (Borg dan Gall, 1983: 275; Poppham, 1981:98). THB yang valid
adalah THB yang mengukur dengan tapat keadaan yang ingin diukur. Sebaliknya,
THB di katakan tidak valid bila digunakan untuk mengukur suatu keadaan yang
tidak tepat diukur dengan THB tersebut.
Misalnya :
Tes tertulis bukan alat ukur yang
valid untuk mengukur ketrampil gaya berenang, tes untuk mengukur hasil belajar
Matematika tidak tepat untuk mengukur
minat terhadap Matematika dan sebagainya.
Sebelum
THB digunakan untuk mengumpulkan data, terhasap dulu harus diperiksa behwa THB
telah valid. Hal itu dipergunakan untuk menjamin adanya kesesuaian antara THB
dengan hasil belajar yang ingin di ukur. Pengumpulan data menggunakan THB yang
tidak valid menghasilkan data hasil belajar yang tidak valid.
Pengujian validitas dapat
dilakukan menggunakan beberapa metode. Menurut Nunally (1978:88), pengukuran
psikologis mempunyai tiga fungsi utam yaitu membuat hubungan statistika dengan
variabel tertentu, menggambarkan wilayah isi tertentu dan mengukur atribut
psikologis. (Kerlinger, 1996: 730-731) mengelompokkan metode pengujian
validitas kriteria dan validitas konstruk. Pengujian validitas melibatkan
perhitungan statistik korelasi sehingga sebelum dibahas berbegai macam
validitas terlebih dulu akan dibahas mengenai konsep korelasi.
·
Konsep
korelasi
Korelasi
berasal dari kata ko yang berarti saling dan relasi yang berarti hubungan,
sehingga korelasi berarti saling berhubungan. Dua hal yang lebih dikatakan
mempunyai saling hubungan apabila diantara mereka terdapat kesejajaran nilai. Korelasi
berhubungan dengan tingkat sejauh mana dua hal atau lebih memiliki kesejajaran
nilai. Kesejajaran nilai mengandung perngertian bahwa bervariasinya sesuatu
gejala diikuti oleh bervariasinya gejala yang lain.
Misalnya :
Bertambahnya
jumlah berang dipasar berhubungan dengan menurunnya harga berang tersebut,
meningkatnya pendapatan berhubungan dengan meningkatnya tabungan masyarakat,
dan sebagainya.
Gejala-gejala
dalam kolerasi terdiri dari variabel bebas dan terikat. Variabel bebas
(independen) adalah variabel yang menimbulkan terjadinya variabel terikat yang
biasa diberikan notasi X. Variabel terikat (dependen) adalah variabel yang
disebabkan oleh variabel bebas yang bisa diberikan notasi Y. Tingkat hubungan
biasa siberikan notasi r (relation) dan hubungan variabel X dan Y di notasikan
rᵪᵧ.
Dalam memberikan penafsiran koefisien realibilitas, rᵪᵧ akan dibandingkan dengan rtabel. Nilai rtabel akan menjadi penentu apakah hubungan X
dan Y (rxy)
signifikan atau terjadi secara kebetulan.
Besar
rtabel sangat
tergantung kepada jumlah peserta (N) dan taraf kesalahannya (a). Pada N yang
lebih besar maka kemungkinan kesalahan kkesimpulan yang dibuat mengenai
hubungan X dan Y lebih kecil sehingga semakin kecil rtabel yang diperlukan. Sebaliknya bila N lebih
kecil maka diperlukan rtabel
yang
lebih besar untuk mengantisipasi peluang kesalahan dalam mengambil kesimpulan
mengenai hubungan X dan Y. Taraf kesalahan (a) berhubungan dangan toleransi
kesalahan yang dapat diterima dalam mengambil keputusan mengenai signifikansi
hubungan X dan Y. Walaupun setiap keputusan yang diambil selalu mengandung
resiko kesalahan yang dipertahkan harus dapat dikendalikan dalam batas
tertentu. Dalam lapangan sosial, toleransi kesalahan yang seringkali digunakan
adalah 1% atau 5%. Bila toleransi kesalahan yang dapat diterima lebih besar
maka dibutuhkan rtabel
yang
lebih kecil untuk memberikan keputusan mengenai hubungan X dan Y. Sebaliknya
bila toleransi kesalahan yang dapat diterima lebih kecil maka dibutuhkan rtabel yang lebih besar.
·
Korelasi dapat terjadi pada berbagai keadaan
Bila ditambanya nilai suatu gejala (X)
diikuti pula dengan bertambahnya nilai gejala lain (Y) maka kedua gejala
cenderung mempunyai korelasi positif. Pada keadaan sempurna dimana setiap
bertambahnya X diikuti bertambahnya Y dan berkurangnya X diikuti bertambahnya Y
maka korelasi X dan Y adalah sebesar +1,00.
Bila bertambahnya nilai suatu gejala
(X) diikuti dengan makin berkurangnya nilai gejala lain (Y) maka kedua gejala
cendrung mempunyai korelasi negatif. Pada keadaan sempurna ini dimana setiap
bertambahnya X diikuti dengan berkurang nya Y dan berkurangnya X diikuti dengan
bertambahnya Y maka korelasi X dan Y adalah sebesar 1,00.
Bila hubungan X dan Y tidak mempunyai
pola, yaitu bertambahnya nilai suatu gejala (X) kadang diikuti dengan bertambahnya
dan kadan diikuti dengan berkurangnya nilai gejala lain (Y) maka kesua gejala
tidak mempunyai hubungan yang bermakna
(signifikan). Hubungan kedua gejala terjadi secara kebetulan. Pada
keadaan sempurna, korelasi X dan Y dalam keadaan demikian adalah sebesar 0,00.
Pengujian
signifikan korelasi dilakukan dengan membandingkan antara korelasi hitung (rxy ) dengan r pada tabel. Pada korelasi
positif, bila rxy
>
rtabel maka dapat
disimpulkan bahwa X dan Y mempunyai korelasi negatif secara signifikan. Notasi
!rxy! di maksdkan bahwa koefisien negatifnya dihilangkan dan diperlukan sebagai
positif. Sebaliknya, pada keadaan dimana rxy atau !rxy! < rtabel maka dapat
disimpulkan bahwa X dan Y tidak mempunyai hubungan yang signifikan. Hubungan X
dan Y terjdi secara kebetulan.
Indeks
korelasi X dan Y dapat di hitung dengan bebrapa cara. Salah satu cara yang
banyak digunakan adalah menggunakan rumus korelasi product moment. Pada cara
ini, indeks korelasi dihitung dengan rumus:
Keterangan
:
N = jumlah peserta
X = variabel bebas
Y = variabel terikat
Berikut adalah contoh kasus dan
cara perhitungan indeks lorelasi:
Nilai dua gejala X dan Y adalah
sebagai berukut:
No
|
Siswa
|
X
|
Y
|
1
|
A
|
40
|
50
|
2
|
B
|
85
|
90
|
3
|
C
|
50
|
60
|
4
|
D
|
70
|
80
|
5
|
E
|
60
|
65
|
Hubungan gejala-gejala itu dapat
diuji sebagai berikut:
§ Menghitung
rxy
Untuk dapat menghitung rxy di
perlukan tabel persiapan perhitungan sebagai berikut:
No
|
Siswa
|
X
|
Y
|
X²
|
Y²
|
XY
|
1
|
A
|
40
|
50
|
1600
|
2500
|
2000
|
2
|
B
|
85
|
90
|
7225
|
8100
|
7650
|
3
|
C
|
50
|
60
|
2500
|
3600
|
3000
|
4
|
D
|
70
|
80
|
4900
|
6400
|
5600
|
5
|
E
|
60
|
65
|
3600
|
4225
|
3900
|
|
Jumlah
|
305
|
345
|
19825
|
24825
|
22150
|
Dengan menggunakan rumus korelasi
product moment dapat di hitung rxy adalah sebesal 0,991
§
Menentuka r tabel
jumlah pesertas (N) adalah 5 orang siswa peserta tes. Bila sitetapkan a =
5%, maka r tabel atau
r (5)(0,05)
= 0,669
§ Menarik
kesimpulan
Oleh karena r hitung = 0,991 >
r tabel = 0,669 maka dapat di simpulkan bahwa X dan Y berkorelasi positif
secara signifikan. Hal itu terlihat bahwa setiap kenaikan X selalu di ikuti
kenaikan Y dan setiap penurunan nilai X selalu diikuti dengan penurunan Y.
·
Validitas
Isi
Validitas isi
adalah pengujian validitas dilakukan atas isinya untuk memastikan apakah buti
THB mengukur secara tepat keadaan yang ingin diukur. Validitas isi berhubungan
dengan representativitas sampel butir dari semesta populasi butir. Secara
teoritik butiran yang dapat dituliskan untuk mengukur hasil belajar jumlahnya
tidak terhingga.
Pengujian
validitas isi yang dilakukan dengan menelah butir dilakukan dengan mencermati
kesesuaian isi butiran yang ditullis dengan perencanaan yang dituangkan dala
kisi-kisi. Kriteria yang menjadi dasar pengujian validitas isi adalah kisi-kisi
yang direncanakan. Reviu dilakukan untuk menjaga agar materi butir THB yang
dikembangkan tidak menyimpang dari kisi-kisi. Butir-butir THB dinyatakan valid apabila setelah mecermati isi
butir-butir yang ditulis telah menunjukkan kesesuaian dengan kisi-kisi.
Pengujian
validitas isi dapat dilakukan dengan meminta pertimbangan ahli. Orang yang
memiliki kopetensi dalam suatu bidang dapat dimintakan pendapatnya untuk
menilai ketepatan isi butir THB. Penilaian dilakukan dengan menentukan pilihan
pada pilihan yang tersedia yaitu “tidak sesuai”, “ragu”, “sesuai”. Skoring
dilakukan dengan memberikan skor-1 pada respons “tidak sesuai”, 0 pada respons
“ragu” dan +1 pada repons “sesuai”. Hasil skoring respons dua orang ahli 10
butir instrumen diringkaskan sebagai berikut:
Butir
|
Rater
1
|
Rater
2
|
1
|
1
|
1
|
2
|
1
|
0
|
3
|
1
|
1
|
4
|
1
|
1
|
5
|
1
|
1
|
6
|
0
|
0
|
7
|
1
|
1
|
8
|
1
|
1
|
9
|
1
|
1
|
10
|
1
|
1
|
Perhitugan korelasi dilakukan
dengan rumus product memont sebagai berikut:
Keterangan:
N = jumlah
responden
X = skor
yang diberikan oleh rater 1
Y = skor
yang diberikan oleh rater 2
Perhitungan dilakukan berdasarkan
tabel persiapan sebagai berikut:
No
|
X
|
Y
|
X
|
Y
|
XY
|
1
|
1
|
1
|
1
|
1
|
1
|
2
|
1
|
0
|
1
|
0
|
0
|
3
|
1
|
1
|
1
|
1
|
1
|
4
|
1
|
1
|
1
|
1
|
1
|
5
|
1
|
1
|
1
|
1
|
1
|
6
|
0
|
0
|
0
|
0
|
0
|
7
|
1
|
1
|
1
|
1
|
1
|
8
|
1
|
1
|
1
|
1
|
1
|
9
|
1
|
1
|
1
|
1
|
1
|
10
|
1
|
1
|
1
|
1
|
1
|
|
9
|
8
|
9
|
8
|
8
|
Hasil korelasi skor kedua rater
menunjukkan indeks korelasi hitung sebesar 0.667
·
Validitas
Kriteria
Validitas kriteria adalah
pengujian validitas yang dilakukan dengan kriteria tertentu di luar THB.
Instrumen dapat dikatakan valid apabila telah mengukur dengan hasil sebagaimana
hasil pengukuran kriterianya. Kesesuaian pengukuran ditunjukan oleh hasil korelasi
yang signifikan antaran skor hasil pengukuran menggunakan THB dengan skor hasil
pengukuran menggunakan instrumen kriteria yang digunakan sebagai dasar
pengujian validitas.
Pada siswa sebanyak 10 orang,
kedua THB memberikan hasil pengukuran sebagai berikut:
No
|
X
|
Y
|
1
|
70
|
82
|
2
|
85
|
80
|
3
|
75
|
72
|
4
|
90
|
87
|
5
|
60
|
65
|
6
|
57
|
73
|
7
|
72
|
70
|
8
|
65
|
60
|
9
|
50
|
65
|
10
|
87
|
80
|
Keterangan :
X = hasil pengukuran
menggunakan THB yang dikembangkan oleh guru.
Y = hasil pengukuran
menggunakan THB yang disusun oleh tim KKG (Kelompok Kerja Guru)
Dari hasil perhitungan korelasi maka diperoleh
korelasi hitung antara kedua skor sebesar 0,754. Konfirmasi pada tabel pada N=
10 dan a = 5% diperoleh r tabel sebesar 0,632. Oleh karena r hitung = 0,754>
r tabel = 0,632 maka skor pada THB yang dekembangkan oleh guru berkorelasi
dignifikan dengan skor pada Thb yang disusun oleh KKG.
·
Validitas
konstruk
Validitas
konstruk adalah pengujian validites yang dilakukan dengan melihat kesesuaian
konstruksi butir yang ditulis dengan kisi-kisinya. Hasil belajar dikonstruk
oleh sejumlah ranah. Beberapa metode dapat digunakan untuk mengujia validitas
konstruk yaitu dengan:
1. Menelaah
butir
2. Memintah
pertimbangan para ahli
3. Konvergensi
dan diskriminabilitas
4. Multitrait-multimethod
5. Analis
faktor
Pengujian
validitas kostruk dengan metode konvergensi dan diskriminabilitas adalah
menguji validitas dengan menggunakan prinsip bahwa sebuah butir bersifat
konvergen dengan butir yang mempunyai konstruksi sama dan bersifat diskriminan
dengan butir yang mempunyai konstruksi yang berbeda. Sebanyak 4 butir tes
diujicobakan kepada sejumlah siswa uji coba dan hasilnya dikorelasikan satu
sama lain sehingga menghasilkan matriks korelasi sebagi berikut.
Butir
|
1
|
2
|
3
|
4
|
1
|
-
|
0,15
|
0,50
|
-0,30
|
2
|
-
|
-
|
0,12
|
0,60
|
3
|
-
|
-
|
-
|
0,05
|
4
|
-
|
-
|
-
|
-
|
Koefisien korelasi dinyatakan
signifikan apabila korelasi hitungnya 0,30 atau lebih. Dari matriks ter sebut
dapat disimpulkan
1. Butiran
1 dan 3 bersifat konvergen sehingga mengukur level kognitif yang sama
2. Butir
2 dan 4 bersifat konvergen sehingga mengukur level kognetif yang sama.
3. Butir
2 dan 3 bersifat diskriminan dengan butir 2 dan 4 sehingga mengukur level
kognitif yang berbeda.
Pengujian validitas konstruk
dengan multitraitmultimethod (MTMM) adalah pengujian validitas yang dilakukan
menggunakan beberapa metode dan beberapa kali testing untuk melihat:
Keadaan konsistensi internal pada
metode yang sama yang diujicobakan beberapa kali
Hasil yang
sama (berkorelasi signifikan ) antara kontruksi yang sama yang di ujikan
menggunakan metode yang berbeda. Untuk memperjelas uraian tersebut, diberikan
contoh. Terdapat dua butir tes hasil belajar yang mempunyai kontruksi yanf
berbeda. Butir 1 mengukur ranah kognitif level hafalan (C1) dan butir 2
mengukur ranah kognitif level penerapan (3). Kedua butiran diukur masing-masing
dalam dua bentuk : esai dan objektif. Keempat butir (2 level – 2 bentuk ) di
ujikan sebanyak dua kali pada sejumlah siswa uji coba. Hasil korelasi antara
mereka diringkaskan dalam sebuah matriks korelasi sebagai berikut:
|
|
|
Testing I
|
|||
|
|
|
Objektif
|
Esai
|
||
|
|
|
C1
|
C3
|
C1
|
C3
|
|
Objektif
|
C1
|
(0,85)
|
-
|
-
|
-
|
Testing II
|
|
C3
|
-0,07
|
(0,88)
|
-
|
-
|
|
Esai
|
C1
|
(0,53)
|
-0,15
|
(0,81)
|
-
|
|
|
C3
|
-0,37
|
(0,54)
|
-0,09
|
(0,82)
|
Dari matriks korelasi tersebut
dapat dibuat kesimpulan sebagai berikut:
Butir tes yang mempunyai
keandalan konsistensi internal yang baik adalah:
1. Butir
level C1 berbentuk objektif pada testing 1 dengan butir tes level C1 berbentuk
objektif pada testing 2 dengan indek korelasi sebesar 0,85
2. Butir
level C3 berbentuk objektif pada teting 1 dengan butir level C3 berbentuk
objektif pada testing 2 dengan indeks korelasi sebesar 0,88
3. Butir
level C1 berbentuk esai pada testing 1 dengan butiran level C1 berbentuk esai
pada testing 2 dengan indek korelasi sebesar 0,81
4. Butir
level C3 berbentuk esai pada testing 1 dengan butir level C3 berbentuk esai
pada testing 2 dengan indks korelasi sebesar 0,82
Butir-butir yang bersifat
konvergen karenamempunyai konstruksi yang sama pada metode yang berbeda
menunjukkan korelasi signifikan .
1. Butir-butir
C1 berbentuk objektif pada testing 1 dengan butir level C1 berbentuk esai pada
testing 1 menunjukkan indeks korelasi sebesar 0,54
2. Butir
level C3 berbentuk objektif pada testing 1 dengan butir level C3 berbentuk esai
pada testing 1 menunjukkan indeks korelasi sebesar 0,53
Butir-butir yang mempunyai
diskriminabilitas karena konstruksinya berbeda akan korelasi tidak signifikan.
1. Butir
level C1 berbentuk objektif pada testing 1 dengan butir level C3 berbentuk
objektif pada testing 2 menunjukkan indeks korelasi sebesar –o,o7.
2. Butir
level C3 berbentuk objektif pada testing 1 dengan butir level C1 berbentuk
objektif pada testing 2 menunjukkan indeks korelasi sebesar -0,37
3. Butir
level C1 berbentuk esai pada testing 1 dengan butir level C3 berbentuk esai
pada testing 2 menunjukkan indeks korelasi sebesar -0,09
4. Butir
level C3 berbentuk esai pada testing 1 dengan butir levelC1 berbentuk esai pada
testing 2 menunjukkan indeks korelasi sebesar -0,15.
Reliabilitas Tes Hasil Belajar
·
Pengertian
Reliabilitas
Keandalan
(reliability) berasal dari kata rely yang artinya percaya dan reliabel yang
artinya dapat dipercaya.
Alat ukur yang reliabel akan
menghasilkan ukuran “yang sebenarnya”. Alat ukur yang reliabel akan memberikan
hasil pengukuran yang relatif stabil dan kosisten karena pengukurannya
menghasikan galat yang minimal.
·
Macam-macam
Relibilitas
Banyak metode yang dapat dipilih
untuk menguji reliabilitas. Metode-metode itu secara garis besar dapat
dikelompokkan menjadi dua kelompok berdasarkan perbedaannya dalam
mendefenisikan reliabilitas.
·
Reliabilitas
merupakan koefisien stabilitas eksternal
Reliabilitas dapat dipandang
sebagai koefisien yang menunjukkan dimilikinya stabilitas eksternal oleh THB.
Beberapa metode pengujian reliabilitas yang memandang behwa reliabilitas
merupakan koefisien stabilitas eksternal adalah metode tes ulang dan paralel.
ü Metode
tes ulang
Metode tes ulang (test retest
method) adalah metode pengujian reliabilitas yang dilakukan dengan mengujikan
sebuah perangkat THB kepada kelompok peserta uji coba yang sama sebnyak dua
kali. Sebagai contoh dapat disajikan skor hasil testing pada uji coba 1 dan 2
suatu THB yang direspons oleh lima orang siswa memberikan hasil sebagai
berikut:
Responden
|
X
|
Y
|
1
|
50
|
65
|
2
|
90
|
87
|
3
|
60
|
50
|
4
|
90
|
95
|
5
|
85
|
74
|
Keterangan :
X = skor responden
pada testing uji coba 1
Y = skor responden
pada testing uji coba 2
Perhitungan yang
dilakukan menggunakan rumus korelasi product moment memberikan hasil korelasi
yang merupakan koefidiwn reliabilitas sebesar 0,82.
ü Metode
paralel
Metode paralel
dipilih apabila tidak diinginkan mengujikan dua kali. Pengujian dilakukan
sekali untuk kedua perangkat. Metode paralel adalah pengujian reliabilitas yang
dilakukan dengan cara membuat dua perangkat THB yang paralel dan mengujikan
sekaligus.berikut diberikan contoh perhitungan koefisian reliabilitas
menggunakan metode paralel. Dalam sebuah
pengujian terhadap dua perangkat THB yang paralel pada liama orang siswa
memberikan hasil pengujian debagai berikut:
Responden
|
X
|
Y
|
1
|
60
|
55
|
2
|
85
|
90
|
3
|
70
|
63
|
4
|
85
|
70
|
5
|
75
|
80
|
Keterangan :
X = skor pada
perangkat 1
Y = skor pada
perangkat 2
Perhitungan yang dilakukan dengan menggunakan rumus korelasi product
moment memberikan hasil korelasi yang merupakan koefisien reliabilitas sebesar
0,79.
·
Reliabilitas
merupakan koefisien konsistensi internal
Pandangan lain
melihat reliabilitas sebagai koefisien yang menunjukkan dimilikinya kosistensi
internal oleh THB. Dalam pandanngan ini THB dinyatakan reliabel apabila hasil
pengukuran pada butir-butir secar internal menunjukkan adanya konsistensi.
Pandangan kelompok ini dapat dikelompokkan lagi menjadi dua. 1) Metode
pengujian reliabilitas yang dilakukan dengan membelah butir menjadi dua bengian
yang sama besar. Cara ini dapat dilakukan apabila butir THB berjumlah genap.
ü Jumlah
butir genap
Metode pengujian reliabitas ini
dilakukan atas THB yang mempunyai jumlah butir genap sehingga butir dapat
dibelah menjadi dua begian yang sama besar. Untuk memperjelas perhitungan
koefisien reliabilitas pada kelompok metode ini maka berikut diberikan contoh:
Berikut adalah hasil tes pada
meta pelajaran Matematika dengan 10 butir soal pilihan ganda pada 5 orang anak.
Responden
|
Butir
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
1
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
2
|
0
|
O
|
1
|
0
|
0
|
1
|
0
|
0
|
0
|
1
|
3
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
4
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
5
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
ü Metode
belah dua
Metode ini
dilakukan apabila guru atau pengembangan soal yang mengembengkan THB tidak
ingin mengujicobakan dua kali dan membuat dua perangkat yang paralel. THB
dibuat hanya datu perangkat dan hanya diujikan sekali, tetapi selanjutnya butir
dibelah menjadi dua. Pembelahan dapat dilakukan dengan membelah butir dalam
butir ganjil dan genap atau awal dan akhir. Misalnya pada instrumen yang
terdiri dari 10 butir, pembelahan ganjil genap dilakukan dengan mengelompokkan
butir 1,3,5,7,9 dalam belahan pertama dan butir 2,4,6,8,10 dalam belahan kedua.
Pada cara lain, pembelahan atas dasar awal –akhir dilakukan dengan
mengelompokkan butir 1,2,3,4,5 dalam belahan pertama dan butir 6,7,8,9,10 dalam
belahan kedua. Berdasarkan contoh yang disajikan di atas, bila pengujian reliabilitas
dilakukan menggunakan metode belah dua yang dilakukan menggunakan metode belah
dua yang dilakukan dengan membelah butir dalam ganjil dan genap maka hasi
pembelahan yang dihasilkan adalah sebagai berikut:
No
|
Butir ganjil
|
Σ
|
Butir genap
|
Σ
|
Σ Σ
|
||||||||
1
|
3
|
5
|
7
|
9
|
2
|
4
|
6
|
8
|
10
|
||||
1
|
1
|
1
|
1
|
1
|
1
|
5
|
1
|
0
|
0
|
1
|
1
|
3
|
8
|
2
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
|
1
|
2
|
3
|
3
|
1
|
1
|
1
|
1
|
1
|
5
|
1
|
1
|
0
|
1
|
1
|
4
|
9
|
4
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
|
2
|
2
|
5
|
1
|
1
|
0
|
1
|
1
|
4
|
1
|
1
|
1
|
1
|
|
4
|
8
|
Jumlah skor kedua belahan
selanjutnya dikorelasikan. Data jumlah skor kedua belahan adalah sebagai
berikut:
Responden
|
X
|
Y
|
1
|
5
|
3
|
2
|
1
|
2
|
3
|
5
|
4
|
4
|
0
|
2
|
5
|
4
|
4
|
Keterangan :
X = jumlah skor butir
belahan ganjil
Y = jumlah skor
butir belahan genap
Perhitungan koefisien
reliabilitas dilakukan dengan mengkorelasikan kedua belahan dengan tabel persiapan
perhitungan sebagai berikut:
No
|
X
|
Y
|
X²
|
Y²
|
XY
|
1
|
5
|
3
|
25
|
9
|
15
|
2
|
1
|
2
|
1
|
4
|
2
|
3
|
5
|
4
|
25
|
16
|
20
|
4
|
0
|
2
|
0
|
4
|
0
|
5
|
4
|
4
|
16
|
16
|
16
|
Jumlah
|
15
|
15
|
67
|
49
|
53
|
Korelasi dilakukan dengan rumus :
Keterangan :
X = skor butir
belahan ganjil
Y = skor butir
belahan genap
N = jumlah responden
Hasi korelasi
skor belahan ganjil dan genap (rxy) menggunakan rumus korelasi product moment
memberikan hasil koefisien korelasi sebesar 0,85. Angka koefisien korelasi
tersebut merupakan korelasi antara setengah tes (r ½.½) karena skor diperoleh
dari hasil pembelahan butir menjadi dua bengian. Koefisien reliabilitas tes
merupakan koefisien reliabilitas penuh, shingga koefisien reliabilitas setengah
tes harus di ubah menjadi koefisien reliabilitas penuh (r11).
Untuuk mengubah koefisien reliabilitas penuh dilakukan menggunakan rumus:
Keterangan :
(r11) = koefisien
reliabilita penuh tes
(r ½.½) = koefisien reliabilitas
setengah tes
Dengan
menggunakan rumus untuk mengubah koefisien reliabilitas setengah menjadi
koefisien reliabilitas penuh THB dapat diperoleh koefisien reliabilitas sebesar
0,92.
Pengujian reliabilitas
menggunakan metode-metode belah dua dapat dilakukan dengan membelah butir
einstrimen menjadi belahan awal-akhir. Hasil pembelahan mengahasilkan data
sebagia berikut:
No
|
Butir awal
|
Σ
|
Butir akhir
|
Σ
|
ΣΣ
|
||||||||
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
1
|
1
|
1
|
1
|
0
|
1
|
4
|
0
|
1
|
1
|
1
|
1
|
4
|
8
|
2
|
0
|
0
|
1
|
0
|
0
|
1
|
1
|
|
0
|
0
|
1
|
2
|
3
|
3
|
1
|
1
|
1
|
1
|
|
5
|
0
|
1
|
1
|
1
|
1
|
4
|
9
|
4
|
0
|
1
|
0
|
0
|
0
|
1
|
0
|
0
|
1
|
0
|
0
|
1
|
2
|
5
|
1
|
1
|
1
|
1
|
0
|
4
|
1
|
1
|
0
|
1
|
0
|
4
|
8
|
Jumlah skor kedua belahan
selanjutnya dikorelasikan. Data jumlah skor kedua belahan adalah sebagai
berikut:
Responden
|
X
|
Y
|
1
|
4
|
4
|
2
|
1
|
2
|
3
|
5
|
4
|
4
|
1
|
1
|
5
|
4
|
4
|
Keterangan :
X = jumlah skor butir
belahan awal
Y = jumlah skor
butir belahan akhir
Perhitungan koefisien reliabilitas dilakukan dengan mengkorelasikan
kedua belahan dengan tabel persiapan perhitungan sebagi berikut:
No
|
X
|
Y
|
X²
|
Y²
|
XY
|
1
|
4
|
4
|
16
|
16
|
16
|
2
|
1
|
2
|
1
|
4
|
2
|
3
|
5
|
4
|
25
|
16
|
20
|
4
|
1
|
1
|
1
|
1
|
1
|
5
|
4
|
4
|
16
|
16
|
16
|
Jumlah
|
15
|
15
|
59
|
53
|
55
|
Korelasi dilakukan dengan
menggunakan rumus:
Keterangan :
X = skor butir
belahan awal
Y = skor butir
belahan akhir
N = jumlah responden
` Hasil korelasi
belahan awan dan akhir mengunkan rumus korelasi product moment memberikan hasil
koefisien korelasi sebesar 0,94. Untuk mengubah koefisien reliabilitas setengah
instrumen menjadi koefisien reliabilitas penuh dilakukan menggunkan rumus:
Keterangan :
(r11) = koefisien
reliabilitas penuh instrumen
(r ½.½) = koefisien reliabilitas
setengah instrumen
Dengan
menggunakan rumus untuk mengubah koefisien reliabilitas menjadi setengah
koefisien reliabilitas penuh THB dapat diperoleh koefisien reliabilitas sebesar
0,97.
ü Jumlah
butir ganjil
Pengujian reliabilitas sebagai
koefisien konsistensi internal dimana butir instrumen berjumlah ganjil dapat
dilakukan menggunkan metode Kuder-Richardson. Untuk menghitung koefisien
reliabilitas menggunkan metode-metode tersebut berikut diberikan contoh
ilustrasi.
Berikut
adalah hasi pengukuran terhadap 10 responden menggunakan lima butir instrumen
untuk mengukur variabel “kreativitas”. Skor maksimum tiap butir adalah 20.
Responden
|
Butir
|
||||
1
|
2
|
3
|
4
|
5
|
|
1
|
15
|
20
|
17
|
18
|
20
|
2
|
10
|
7
|
12
|
9
|
10
|
3
|
5
|
7
|
5
|
8
|
5
|
4
|
20
|
20
|
17
|
20
|
18
|
5
|
15
|
17
|
15
|
18
|
17
|
6
|
7
|
8
|
7
|
5
|
9
|
7
|
15
|
17
|
14
|
15
|
15
|
8
|
20
|
19
|
17
|
20
|
17
|
9
|
15
|
15
|
16
|
14
|
15
|
10
|
4
|
3
|
4
|
4
|
3
|
·
Batas
keputusan reliabilitas
Pembuatan
keputudan apakah sebuah THB dapat dinyatakan reliabel atau tidak didasarkan
pada batas untuk membuat keputudan reliabilitas. Angka koefisien reliabilitas
yang dihitung melalui berbegai metode pengujian reliabilitas measih harus di
konfirmasikan dengan batas tertentu untuk dapat sitafsikan reliabel atau tidak.
THB dinyatakan reliabel apabila koefisien yang diperoleh melalui perhitungan
menggunkan metode pengujian reliabilitas tertentu lebih besar dibandingkan
dengan batas keputudan reliabilitas. Beberapa pertimbangan dalam menetukan
seberapa tinggi seharusnya sebuah reliabilitas:
1. Tingkat
pentingnya keputusan.
Apabila
keputusan yang diambil berdasarkan skor yang dikumpulkan dari THB mempunyai
konsekuensi yang sangat penting bagi siswa maka menuntut THB dengan
reliabilitas yang sngat tinggi.
2. Dapat
tidaknya keputusan dapat di perbaiki dalam waktu yang cepat.
Dalam
tahap awal pengambilan keputusan pendidikan, reliabilitas yang rendah mungkin
cukup karena kesalahan pengambilan keputusan dapat diperbaiki segera.
3. Jaminan
yang kita butuhkan sehubungan dengan keputusn yang dibuat.
Jaminan
yang lebih besar mempersyaratkan reliabilitas yang lebih tinggi.
Pada
hakikatnya indeks raliabilitas merupakan korelasi tes dengan tes itu sendiri (rtt)
untuk melihat apakah hasil pengukuran yang stabil dan konsisten. Oleh karena
indeks reliabiliatas merupakan korelasi hitung maka batas kriteria reliabilitas
adalah tabel korelasi. Bila r hitung > r tabel maka kedua skor hasil
pengukuran THB berkorelasi signifikan. Signifikan korelasi menunjukan adanya
konsistensi sehingga THB telah dapat dikatakan reliabel.
·
Kesalahan
standar pengukuran
Kalau validitas berhubugan dengan
ketepatan THb dalam mengukur hasi belajar yang diinginkan, reliabilitas lebih
berhubungan dengan akurasi THB dalam melakukan pengukuran. THB yang mempun
mmengukur hasil belajar dengan akurasi dan presisi yang tinggi akan
meminimalkan kesalahan THB dalam melakukan pengukuran. THB yang mampu melakukan
pengukuran secara akurat dengan tingkat kesalahan pengukuran yang rendah akan
memberikan hasil pengukuran yang relatif kosisten dan stabil (reliabel).
Kesalahan
standar pengukuran adalah ukuran yang mencerminkan tidak akuratnya skor dari
THB yang digunakan untuk mengukur. Semakin tinggi koifisien reliabilitas maka
THB semakin akurat dan makin rendah kesalahan standar pengukuran, dan
sebaliknya.
Kesalahan standar pengukuran
dihitung menggunakan rumus sebagai berikut:
SEM = SD
Keterangan :
SEM = standard error of measurement
SD = standar diviasi
rtt = koefisien reliabilitas.
Misalnya seseorang siswa X
memperoleh skor 50 pada THB yang mempunyai koefisien reliabilitas sebesar 0,977
yang diperoleh dari kelompok siswa yang mempunyai standar deviasi 13,51. Bila
taraf kepercayaan yang ditentukan 90% (atau taraf signifikasi p= 0,10),
berapakah interval keparcayaan terhadap skor murni siswa X?
Untuk menjawab itu di tempuh beberapa langkah:
1.
Menghitung kesalahan standar pengukuran (SEM)
SEM = 13,51 = 2,049
2.
Mencari nilai Z pada distribusi normal
untuk kedua ujung kurva. Oleh karena p= 0,10 maka p kedua ujuang masing-masing
p = 0,05. Dengan melihat tabel Z diketahui harga tabel untuk p = 0,05 adalah
1,645.
3.
Menghitung interval kepercayaan skor
murni responden X. Oleh karena skor yang diperoleh X = 50 dan harga tabel Z =
1,645 maka interval kepercayaan skor murni (true score = T) dapat di hitung
sebagai berikkut :
50-(1,645)(2,049)<T<50+
(1,645)(2,049)
46,63 dibulatkan 47<T<53,37
dibulatkan 53
Dari hasil perhitungan dapat diambil
kesimpulan sebagai berikut :
1.
Walaupun data yang diperoleh dari
pengukuran siwa X sebesar 50, namun ada kemungkinan 90% bahwa skor hasil
belajar sesungguhnya siswa X beberapa diantara 47 dapai 53. Kemungkinan skor
siswa X berada di atas 53 atau di bawah 47 hanyalah 10%.
2.
Lebar interval 47 sampai 53 adalah enam
interval. Lebar interval menunjukan ketidak cermatan pengukuran. Makin sempit
interval maka pengukuran makin cermat dan memuaskan. Sebaliknya, semakin lebar
interval maka ukuran makin kurang cermat.
Daftar
Pustaka
Aiken, Lewis R (1995). Rating scales and checklist:
evaluating behavior, personality and attitude. New York: Jhon wiley & Sons,
Inc
Azwar, Saifuddin (1995). Sikap manusia teori dan
pengukurannya . Yogyakarta: Pustaka Pelajar
Arikunto, Suharsimi (1995) Dasar-dasar Evaluasi Pendidikan.
Jakarta: Bumi Aksara
Echols, Jhon M dan Shadily, Hassan (1993). Kamus Inggris
Indonesia. Jakarta: PT Gramedia
Crocker, Linda dan Algina, James (1986). Intruduction to
Classical and Modern Test Theory. Forth Worth: Holt, Rinehart and Winston, Inc.
Tidak ada komentar:
Posting Komentar