Jejak Pendidikan: Validitas dan Reliabilitas Tes Hasil belajar

by : Charles Sim

Validitas Tes Hasil Belajar

v Pendahuluan

Tes hasil belajar adalah alat ukur yang digunakan untuk melakukan pengukuran guna pengumpulan data hasil belajar. Sebagai sebuah alat ukur maka THB harus memenuhi syarat sebagai alat ukur yang baik. Alat ukur yang baik harus memenuhi dua syarat validitas dan realibilitas. Oleh karena itu, sebelum di gunakan untuk mengumpulkan data THB harus terlebih dulu diuji validitas dan realibilitasnya.

Pengujian validitas dan realibilitas dapat dilakukan dengan beberapa cara. Tulisan ini membahas tentang pengujian validitas THB dan beberapa metode yang dapat digunakan untuk pengujian.

v Validitas

Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu yang diinginkan diukur. Menurut Anastasi dan Urbin (1997: 113), validitas berhubungan dengan apakah tes mengukur apa yang mesti diukurnya dan seberapa baik dia melakukannya. Validitas merupakan derajad sejauh mana tes mengukur apa yang ingin diukur (Borg dan Gall, 1983: 275; Poppham, 1981:98). THB yang valid adalah THB yang mengukur dengan tapat keadaan yang ingin diukur. Sebaliknya, THB di katakan tidak valid bila digunakan untuk mengukur suatu keadaan yang tidak tepat diukur dengan THB tersebut.

Misalnya :

Tes tertulis bukan alat ukur yang valid untuk mengukur ketrampil gaya berenang, tes untuk mengukur hasil belajar Matematika tidak tepat untuk mengukur minat terhadap Matematika dan sebagainya.

Sebelum THB digunakan untuk mengumpulkan data, terhasap dulu harus diperiksa behwa THB telah valid. Hal itu dipergunakan untuk menjamin adanya kesesuaian antara THB dengan hasil belajar yang ingin di ukur. Pengumpulan data menggunakan THB yang tidak valid menghasilkan data hasil belajar yang tidak valid.

Pengujian validitas dapat dilakukan menggunakan beberapa metode. Menurut Nunally (1978:88), pengukuran psikologis mempunyai tiga fungsi utam yaitu membuat hubungan statistika dengan variabel tertentu, menggambarkan wilayah isi tertentu dan mengukur atribut psikologis. (Kerlinger, 1996: 730-731) mengelompokkan metode pengujian validitas kriteria dan validitas konstruk. Pengujian validitas melibatkan perhitungan statistik korelasi sehingga sebelum dibahas berbegai macam validitas terlebih dulu akan dibahas mengenai konsep korelasi.

· Konsep korelasi

Korelasi berasal dari kata ko yang berarti saling dan relasi yang berarti hubungan, sehingga korelasi berarti saling berhubungan. Dua hal yang lebih dikatakan mempunyai saling hubungan apabila diantara mereka terdapat kesejajaran nilai. Korelasi berhubungan dengan tingkat sejauh mana dua hal atau lebih memiliki kesejajaran nilai. Kesejajaran nilai mengandung perngertian bahwa bervariasinya sesuatu gejala diikuti oleh bervariasinya gejala yang lain.

Misalnya :

Bertambahnya jumlah berang dipasar berhubungan dengan menurunnya harga berang tersebut, meningkatnya pendapatan berhubungan dengan meningkatnya tabungan masyarakat, dan sebagainya.

Gejala-gejala dalam kolerasi terdiri dari variabel bebas dan terikat. Variabel bebas (independen) adalah variabel yang menimbulkan terjadinya variabel terikat yang biasa diberikan notasi X. Variabel terikat (dependen) adalah variabel yang disebabkan oleh variabel bebas yang bisa diberikan notasi Y. Tingkat hubungan biasa siberikan notasi r (relation) dan hubungan variabel X dan Y di notasikan rᵪᵧ. Dalam memberikan penafsiran koefisien realibilitas, rᵪᵧ akan dibandingkan dengan rtabel. Nilai rtabel akan menjadi penentu apakah hubungan X dan Y (rxy) signifikan atau terjadi secara kebetulan.

Besar rtabel sangat tergantung kepada jumlah peserta (N) dan taraf kesalahannya (a). Pada N yang lebih besar maka kemungkinan kesalahan kkesimpulan yang dibuat mengenai hubungan X dan Y lebih kecil sehingga semakin kecil rtabel yang diperlukan. Sebaliknya bila N lebih kecil maka diperlukan rtabel yang lebih besar untuk mengantisipasi peluang kesalahan dalam mengambil kesimpulan mengenai hubungan X dan Y. Taraf kesalahan (a) berhubungan dangan toleransi kesalahan yang dapat diterima dalam mengambil keputusan mengenai signifikansi hubungan X dan Y. Walaupun setiap keputusan yang diambil selalu mengandung resiko kesalahan yang dipertahkan harus dapat dikendalikan dalam batas tertentu. Dalam lapangan sosial, toleransi kesalahan yang seringkali digunakan adalah 1% atau 5%. Bila toleransi kesalahan yang dapat diterima lebih besar maka dibutuhkan rtabel yang lebih kecil untuk memberikan keputusan mengenai hubungan X dan Y. Sebaliknya bila toleransi kesalahan yang dapat diterima lebih kecil maka dibutuhkan rtabel yang lebih besar.

· Korelasi dapat terjadi pada berbagai keadaan

Bila ditambanya nilai suatu gejala (X) diikuti pula dengan bertambahnya nilai gejala lain (Y) maka kedua gejala cenderung mempunyai korelasi positif. Pada keadaan sempurna dimana setiap bertambahnya X diikuti bertambahnya Y dan berkurangnya X diikuti bertambahnya Y maka korelasi X dan Y adalah sebesar +1,00.

Bila bertambahnya nilai suatu gejala (X) diikuti dengan makin berkurangnya nilai gejala lain (Y) maka kedua gejala cendrung mempunyai korelasi negatif. Pada keadaan sempurna ini dimana setiap bertambahnya X diikuti dengan berkurang nya Y dan berkurangnya X diikuti dengan bertambahnya Y maka korelasi X dan Y adalah sebesar 1,00.

Bila hubungan X dan Y tidak mempunyai pola, yaitu bertambahnya nilai suatu gejala (X) kadang diikuti dengan bertambahnya dan kadan diikuti dengan berkurangnya nilai gejala lain (Y) maka kesua gejala tidak mempunyai hubungan yang bermakna (signifikan). Hubungan kedua gejala terjadi secara kebetulan. Pada keadaan sempurna, korelasi X dan Y dalam keadaan demikian adalah sebesar 0,00.

Pengujian signifikan korelasi dilakukan dengan membandingkan antara korelasi hitung (rxy ) dengan r pada tabel. Pada korelasi positif, bila rxy > rtabel maka dapat disimpulkan bahwa X dan Y mempunyai korelasi negatif secara signifikan. Notasi !rxy! di maksdkan bahwa koefisien negatifnya dihilangkan dan diperlukan sebagai positif. Sebaliknya, pada keadaan dimana rxy atau !rxy! < rtabel maka dapat disimpulkan bahwa X dan Y tidak mempunyai hubungan yang signifikan. Hubungan X dan Y terjdi secara kebetulan.

Indeks korelasi X dan Y dapat di hitung dengan bebrapa cara. Salah satu cara yang banyak digunakan adalah menggunakan rumus korelasi product moment. Pada cara ini, indeks korelasi dihitung dengan rumus:

Keterangan :

N = jumlah peserta

X = variabel bebas

Y = variabel terikat

Berikut adalah contoh kasus dan cara perhitungan indeks lorelasi:

Nilai dua gejala X dan Y adalah sebagai berukut:

No	Siswa	X	Y
1	A	40	50
2	B	85	90
3	C	50	60
4	D	70	80
5	E	60	65

Hubungan gejala-gejala itu dapat diuji sebagai berikut:

§ Menghitung rxy

Untuk dapat menghitung rxy di perlukan tabel persiapan perhitungan sebagai berikut:

No	Siswa	X	Y	X²	Y²	XY
1	A	40	50	1600	2500	2000
2	B	85	90	7225	8100	7650
3	C	50	60	2500	3600	3000
4	D	70	80	4900	6400	5600
5	E	60	65	3600	4225	3900
	Jumlah	305	345	19825	24825	22150

Dengan menggunakan rumus korelasi product moment dapat di hitung rxy adalah sebesal 0,991

§ Menentuka r tabel

jumlah pesertas (N) adalah 5 orang siswa peserta tes. Bila sitetapkan a = 5%, maka r tabel atau r (5)(0,05) = 0,669

§ Menarik kesimpulan

Oleh karena r hitung = 0,991 > r tabel = 0,669 maka dapat di simpulkan bahwa X dan Y berkorelasi positif secara signifikan. Hal itu terlihat bahwa setiap kenaikan X selalu di ikuti kenaikan Y dan setiap penurunan nilai X selalu diikuti dengan penurunan Y.

· Validitas Isi

Validitas isi adalah pengujian validitas dilakukan atas isinya untuk memastikan apakah buti THB mengukur secara tepat keadaan yang ingin diukur. Validitas isi berhubungan dengan representativitas sampel butir dari semesta populasi butir. Secara teoritik butiran yang dapat dituliskan untuk mengukur hasil belajar jumlahnya tidak terhingga.

Pengujian validitas isi yang dilakukan dengan menelah butir dilakukan dengan mencermati kesesuaian isi butiran yang ditullis dengan perencanaan yang dituangkan dala kisi-kisi. Kriteria yang menjadi dasar pengujian validitas isi adalah kisi-kisi yang direncanakan. Reviu dilakukan untuk menjaga agar materi butir THB yang dikembangkan tidak menyimpang dari kisi-kisi. Butir-butir THB dinyatakan valid apabila setelah mecermati isi butir-butir yang ditulis telah menunjukkan kesesuaian dengan kisi-kisi.

Pengujian validitas isi dapat dilakukan dengan meminta pertimbangan ahli. Orang yang memiliki kopetensi dalam suatu bidang dapat dimintakan pendapatnya untuk menilai ketepatan isi butir THB. Penilaian dilakukan dengan menentukan pilihan pada pilihan yang tersedia yaitu “tidak sesuai”, “ragu”, “sesuai”. Skoring dilakukan dengan memberikan skor-1 pada respons “tidak sesuai”, 0 pada respons “ragu” dan +1 pada repons “sesuai”. Hasil skoring respons dua orang ahli 10 butir instrumen diringkaskan sebagai berikut:

Butir	Rater 1	Rater 2
1	1	1
2	1	0
3	1	1
4	1	1
5	1	1
6	0	0
7	1	1
8	1	1
9	1	1
10	1	1

Perhitugan korelasi dilakukan dengan rumus product memont sebagai berikut:

Keterangan:

N = jumlah responden

X = skor yang diberikan oleh rater 1

Y = skor yang diberikan oleh rater 2

Perhitungan dilakukan berdasarkan tabel persiapan sebagai berikut:

No	X	Y	X	Y	XY
1	1	1	1	1	1
2	1	0	1	0	0
3	1	1	1	1	1
4	1	1	1	1	1
5	1	1	1	1	1
6	0	0	0	0	0
7	1	1	1	1	1
8	1	1	1	1	1
9	1	1	1	1	1
10	1	1	1	1	1
	9	8	9	8	8

Hasil korelasi skor kedua rater menunjukkan indeks korelasi hitung sebesar 0.667

· Validitas Kriteria

Validitas kriteria adalah pengujian validitas yang dilakukan dengan kriteria tertentu di luar THB. Instrumen dapat dikatakan valid apabila telah mengukur dengan hasil sebagaimana hasil pengukuran kriterianya. Kesesuaian pengukuran ditunjukan oleh hasil korelasi yang signifikan antaran skor hasil pengukuran menggunakan THB dengan skor hasil pengukuran menggunakan instrumen kriteria yang digunakan sebagai dasar pengujian validitas.

Pada siswa sebanyak 10 orang, kedua THB memberikan hasil pengukuran sebagai berikut:

No	X	Y
1	70	82
2	85	80
3	75	72
4	90	87
5	60	65
6	57	73
7	72	70
8	65	60
9	50	65
10	87	80

Keterangan :

X = hasil pengukuran menggunakan THB yang dikembangkan oleh guru.

Y = hasil pengukuran menggunakan THB yang disusun oleh tim KKG (Kelompok Kerja Guru)

Dari hasil perhitungan korelasi maka diperoleh korelasi hitung antara kedua skor sebesar 0,754. Konfirmasi pada tabel pada N= 10 dan a = 5% diperoleh r tabel sebesar 0,632. Oleh karena r hitung = 0,754> r tabel = 0,632 maka skor pada THB yang dekembangkan oleh guru berkorelasi dignifikan dengan skor pada Thb yang disusun oleh KKG.

· Validitas konstruk

Validitas konstruk adalah pengujian validites yang dilakukan dengan melihat kesesuaian konstruksi butir yang ditulis dengan kisi-kisinya. Hasil belajar dikonstruk oleh sejumlah ranah. Beberapa metode dapat digunakan untuk mengujia validitas konstruk yaitu dengan:

1. Menelaah butir

2. Memintah pertimbangan para ahli

3. Konvergensi dan diskriminabilitas

4. Multitrait-multimethod

5. Analis faktor

Pengujian validitas kostruk dengan metode konvergensi dan diskriminabilitas adalah menguji validitas dengan menggunakan prinsip bahwa sebuah butir bersifat konvergen dengan butir yang mempunyai konstruksi sama dan bersifat diskriminan dengan butir yang mempunyai konstruksi yang berbeda. Sebanyak 4 butir tes diujicobakan kepada sejumlah siswa uji coba dan hasilnya dikorelasikan satu sama lain sehingga menghasilkan matriks korelasi sebagi berikut.

Butir	1	2	3	4
1	-	0,15	0,50	-0,30
2	-	-	0,12	0,60
3	-	-	-	0,05
4	-	-	-	-

Koefisien korelasi dinyatakan signifikan apabila korelasi hitungnya 0,30 atau lebih. Dari matriks ter sebut dapat disimpulkan

1. Butiran 1 dan 3 bersifat konvergen sehingga mengukur level kognitif yang sama

2. Butir 2 dan 4 bersifat konvergen sehingga mengukur level kognetif yang sama.

3. Butir 2 dan 3 bersifat diskriminan dengan butir 2 dan 4 sehingga mengukur level kognitif yang berbeda.

Pengujian validitas konstruk dengan multitraitmultimethod (MTMM) adalah pengujian validitas yang dilakukan menggunakan beberapa metode dan beberapa kali testing untuk melihat:

Keadaan konsistensi internal pada metode yang sama yang diujicobakan beberapa kali

Hasil yang sama (berkorelasi signifikan ) antara kontruksi yang sama yang di ujikan menggunakan metode yang berbeda. Untuk memperjelas uraian tersebut, diberikan contoh. Terdapat dua butir tes hasil belajar yang mempunyai kontruksi yanf berbeda. Butir 1 mengukur ranah kognitif level hafalan (C1) dan butir 2 mengukur ranah kognitif level penerapan (3). Kedua butiran diukur masing-masing dalam dua bentuk : esai dan objektif. Keempat butir (2 level – 2 bentuk ) di ujikan sebanyak dua kali pada sejumlah siswa uji coba. Hasil korelasi antara mereka diringkaskan dalam sebuah matriks korelasi sebagai berikut:

			Testing I
			Objektif		Esai
			C1	C3	C1	C3
	Objektif	C1	(0,85)	-	-	-
Testing II		C3	-0,07	(0,88)	-	-
	Esai	C1	(0,53)	-0,15	(0,81)	-
		C3	-0,37	(0,54)	-0,09	(0,82)

Dari matriks korelasi tersebut dapat dibuat kesimpulan sebagai berikut:

Butir tes yang mempunyai keandalan konsistensi internal yang baik adalah:

1. Butir level C1 berbentuk objektif pada testing 1 dengan butir tes level C1 berbentuk objektif pada testing 2 dengan indek korelasi sebesar 0,85

2. Butir level C3 berbentuk objektif pada teting 1 dengan butir level C3 berbentuk objektif pada testing 2 dengan indeks korelasi sebesar 0,88

3. Butir level C1 berbentuk esai pada testing 1 dengan butiran level C1 berbentuk esai pada testing 2 dengan indek korelasi sebesar 0,81

4. Butir level C3 berbentuk esai pada testing 1 dengan butir level C3 berbentuk esai pada testing 2 dengan indks korelasi sebesar 0,82

Butir-butir yang bersifat konvergen karenamempunyai konstruksi yang sama pada metode yang berbeda menunjukkan korelasi signifikan .

1. Butir-butir C1 berbentuk objektif pada testing 1 dengan butir level C1 berbentuk esai pada testing 1 menunjukkan indeks korelasi sebesar 0,54

2. Butir level C3 berbentuk objektif pada testing 1 dengan butir level C3 berbentuk esai pada testing 1 menunjukkan indeks korelasi sebesar 0,53

Butir-butir yang mempunyai diskriminabilitas karena konstruksinya berbeda akan korelasi tidak signifikan.

1. Butir level C1 berbentuk objektif pada testing 1 dengan butir level C3 berbentuk objektif pada testing 2 menunjukkan indeks korelasi sebesar –o,o7.

2. Butir level C3 berbentuk objektif pada testing 1 dengan butir level C1 berbentuk objektif pada testing 2 menunjukkan indeks korelasi sebesar -0,37

3. Butir level C1 berbentuk esai pada testing 1 dengan butir level C3 berbentuk esai pada testing 2 menunjukkan indeks korelasi sebesar -0,09

4. Butir level C3 berbentuk esai pada testing 1 dengan butir levelC1 berbentuk esai pada testing 2 menunjukkan indeks korelasi sebesar -0,15.

Reliabilitas Tes Hasil Belajar

· Pengertian Reliabilitas

Keandalan (reliability) berasal dari kata rely yang artinya percaya dan reliabel yang artinya dapat dipercaya.

Alat ukur yang reliabel akan menghasilkan ukuran “yang sebenarnya”. Alat ukur yang reliabel akan memberikan hasil pengukuran yang relatif stabil dan kosisten karena pengukurannya menghasikan galat yang minimal.

· Macam-macam Relibilitas

Banyak metode yang dapat dipilih untuk menguji reliabilitas. Metode-metode itu secara garis besar dapat dikelompokkan menjadi dua kelompok berdasarkan perbedaannya dalam mendefenisikan reliabilitas.

· Reliabilitas merupakan koefisien stabilitas eksternal

Reliabilitas dapat dipandang sebagai koefisien yang menunjukkan dimilikinya stabilitas eksternal oleh THB. Beberapa metode pengujian reliabilitas yang memandang behwa reliabilitas merupakan koefisien stabilitas eksternal adalah metode tes ulang dan paralel.

ü Metode tes ulang

Metode tes ulang (test retest method) adalah metode pengujian reliabilitas yang dilakukan dengan mengujikan sebuah perangkat THB kepada kelompok peserta uji coba yang sama sebnyak dua kali. Sebagai contoh dapat disajikan skor hasil testing pada uji coba 1 dan 2 suatu THB yang direspons oleh lima orang siswa memberikan hasil sebagai berikut:

Responden	X	Y
1	50	65
2	90	87
3	60	50
4	90	95
5	85	74

Keterangan :

X = skor responden pada testing uji coba 1

Y = skor responden pada testing uji coba 2

Perhitungan yang dilakukan menggunakan rumus korelasi product moment memberikan hasil korelasi yang merupakan koefidiwn reliabilitas sebesar 0,82.

ü Metode paralel

Metode paralel dipilih apabila tidak diinginkan mengujikan dua kali. Pengujian dilakukan sekali untuk kedua perangkat. Metode paralel adalah pengujian reliabilitas yang dilakukan dengan cara membuat dua perangkat THB yang paralel dan mengujikan sekaligus.berikut diberikan contoh perhitungan koefisian reliabilitas menggunakan metode paralel. Dalam sebuah pengujian terhadap dua perangkat THB yang paralel pada liama orang siswa memberikan hasil pengujian debagai berikut:

Responden	X	Y
1	60	55
2	85	90
3	70	63
4	85	70
5	75	80

Keterangan :

X = skor pada perangkat 1

Y = skor pada perangkat 2

Perhitungan yang dilakukan dengan menggunakan rumus korelasi product moment memberikan hasil korelasi yang merupakan koefisien reliabilitas sebesar 0,79.

· Reliabilitas merupakan koefisien konsistensi internal

Pandangan lain melihat reliabilitas sebagai koefisien yang menunjukkan dimilikinya kosistensi internal oleh THB. Dalam pandanngan ini THB dinyatakan reliabel apabila hasil pengukuran pada butir-butir secar internal menunjukkan adanya konsistensi. Pandangan kelompok ini dapat dikelompokkan lagi menjadi dua. 1) Metode pengujian reliabilitas yang dilakukan dengan membelah butir menjadi dua bengian yang sama besar. Cara ini dapat dilakukan apabila butir THB berjumlah genap.

ü Jumlah butir genap

Metode pengujian reliabitas ini dilakukan atas THB yang mempunyai jumlah butir genap sehingga butir dapat dibelah menjadi dua begian yang sama besar. Untuk memperjelas perhitungan koefisien reliabilitas pada kelompok metode ini maka berikut diberikan contoh:

Berikut adalah hasil tes pada meta pelajaran Matematika dengan 10 butir soal pilihan ganda pada 5 orang anak.

Responden	Butir
Responden	1	2	3	4	5	6	7	8	9	10
1	1	1	1	0	1	0	1	1	1	1
2	0	O	1	0	0	1	0	0	0	1
3	1	1	1	1	1	0	1	1	1	1
4	0	1	0	0	0	0	0	1	0	0
5	1	1	1	1	0	1	1	1	1	0

ü Metode belah dua

Metode ini dilakukan apabila guru atau pengembangan soal yang mengembengkan THB tidak ingin mengujicobakan dua kali dan membuat dua perangkat yang paralel. THB dibuat hanya datu perangkat dan hanya diujikan sekali, tetapi selanjutnya butir dibelah menjadi dua. Pembelahan dapat dilakukan dengan membelah butir dalam butir ganjil dan genap atau awal dan akhir. Misalnya pada instrumen yang terdiri dari 10 butir, pembelahan ganjil genap dilakukan dengan mengelompokkan butir 1,3,5,7,9 dalam belahan pertama dan butir 2,4,6,8,10 dalam belahan kedua. Pada cara lain, pembelahan atas dasar awal –akhir dilakukan dengan mengelompokkan butir 1,2,3,4,5 dalam belahan pertama dan butir 6,7,8,9,10 dalam belahan kedua. Berdasarkan contoh yang disajikan di atas, bila pengujian reliabilitas dilakukan menggunakan metode belah dua yang dilakukan menggunakan metode belah dua yang dilakukan dengan membelah butir dalam ganjil dan genap maka hasi pembelahan yang dihasilkan adalah sebagai berikut:

No	Butir ganjil					Σ	Butir genap					Σ	Σ Σ
No	1	3	5	7	9	Σ	2	4	6	8	10	Σ	Σ Σ
1	1	1	1	1	1	5	1	0	0	1	1	3	8
2	0	0	0	0	0	1	0	0	1		1	2	3
3	1	1	1	1	1	5	1	1	0	1	1	4	9
4	0	0	0	0	0	0	1	0	0	1		2	2
5	1	1	0	1	1	4	1	1	1	1		4	8

Jumlah skor kedua belahan selanjutnya dikorelasikan. Data jumlah skor kedua belahan adalah sebagai berikut:

Responden	X	Y
1	5	3
2	1	2
3	5	4
4	0	2
5	4	4

Keterangan :

X = jumlah skor butir belahan ganjil

Y = jumlah skor butir belahan genap

Perhitungan koefisien reliabilitas dilakukan dengan mengkorelasikan kedua belahan dengan tabel persiapan perhitungan sebagai berikut:

No	X	Y	X²	Y²	XY
1	5	3	25	9	15
2	1	2	1	4	2
3	5	4	25	16	20
4	0	2	0	4	0
5	4	4	16	16	16
Jumlah	15	15	67	49	53

Korelasi dilakukan dengan rumus :

Keterangan :

X = skor butir belahan ganjil

Y = skor butir belahan genap

N = jumlah responden

Hasi korelasi skor belahan ganjil dan genap (rxy) menggunakan rumus korelasi product moment memberikan hasil koefisien korelasi sebesar 0,85. Angka koefisien korelasi tersebut merupakan korelasi antara setengah tes (r ½.½) karena skor diperoleh dari hasil pembelahan butir menjadi dua bengian. Koefisien reliabilitas tes merupakan koefisien reliabilitas penuh, shingga koefisien reliabilitas setengah tes harus di ubah menjadi koefisien reliabilitas penuh (r11). Untuuk mengubah koefisien reliabilitas penuh dilakukan menggunakan rumus:

Keterangan :

(r11) = koefisien reliabilita penuh tes

(r ½.½) = koefisien reliabilitas setengah tes

Dengan menggunakan rumus untuk mengubah koefisien reliabilitas setengah menjadi koefisien reliabilitas penuh THB dapat diperoleh koefisien reliabilitas sebesar 0,92.

Pengujian reliabilitas menggunakan metode-metode belah dua dapat dilakukan dengan membelah butir einstrimen menjadi belahan awal-akhir. Hasil pembelahan mengahasilkan data sebagia berikut:

No	Butir awal					Σ	Butir akhir					Σ	ΣΣ
	1	2	3	4	5	Σ	6	7	8	9	10	Σ	ΣΣ
1	1	1	1	0	1	4	0	1	1	1	1	4	8
2	0	0	1	0	0	1	1		0	0	1	2	3
3	1	1	1	1		5	0	1	1	1	1	4	9
4	0	1	0	0	0	1	0	0	1	0	0	1	2
5	1	1	1	1	0	4	1	1	0	1	0	4	8

Jumlah skor kedua belahan selanjutnya dikorelasikan. Data jumlah skor kedua belahan adalah sebagai berikut:

Responden	X	Y
1	4	4
2	1	2
3	5	4
4	1	1
5	4	4

Keterangan :

X = jumlah skor butir belahan awal

Y = jumlah skor butir belahan akhir

Perhitungan koefisien reliabilitas dilakukan dengan mengkorelasikan kedua belahan dengan tabel persiapan perhitungan sebagi berikut:

No	X	Y	X²	Y²	XY
1	4	4	16	16	16
2	1	2	1	4	2
3	5	4	25	16	20
4	1	1	1	1	1
5	4	4	16	16	16
Jumlah	15	15	59	53	55

Korelasi dilakukan dengan menggunakan rumus:

Keterangan :

X = skor butir belahan awal

Y = skor butir belahan akhir

N = jumlah responden

` Hasil korelasi belahan awan dan akhir mengunkan rumus korelasi product moment memberikan hasil koefisien korelasi sebesar 0,94. Untuk mengubah koefisien reliabilitas setengah instrumen menjadi koefisien reliabilitas penuh dilakukan menggunkan rumus:

Keterangan :

(r11) = koefisien reliabilitas penuh instrumen

(r ½.½) = koefisien reliabilitas setengah instrumen

Dengan menggunakan rumus untuk mengubah koefisien reliabilitas menjadi setengah koefisien reliabilitas penuh THB dapat diperoleh koefisien reliabilitas sebesar 0,97.

ü Jumlah butir ganjil

Pengujian reliabilitas sebagai koefisien konsistensi internal dimana butir instrumen berjumlah ganjil dapat dilakukan menggunkan metode Kuder-Richardson. Untuk menghitung koefisien reliabilitas menggunkan metode-metode tersebut berikut diberikan contoh ilustrasi.

Berikut adalah hasi pengukuran terhadap 10 responden menggunakan lima butir instrumen untuk mengukur variabel “kreativitas”. Skor maksimum tiap butir adalah 20.

Responden	Butir
Responden	1	2	3	4	5
1	15	20	17	18	20
2	10	7	12	9	10
3	5	7	5	8	5
4	20	20	17	20	18
5	15	17	15	18	17
6	7	8	7	5	9
7	15	17	14	15	15
8	20	19	17	20	17
9	15	15	16	14	15
10	4	3	4	4	3

· Batas keputusan reliabilitas

Pembuatan keputudan apakah sebuah THB dapat dinyatakan reliabel atau tidak didasarkan pada batas untuk membuat keputudan reliabilitas. Angka koefisien reliabilitas yang dihitung melalui berbegai metode pengujian reliabilitas measih harus di konfirmasikan dengan batas tertentu untuk dapat sitafsikan reliabel atau tidak. THB dinyatakan reliabel apabila koefisien yang diperoleh melalui perhitungan menggunkan metode pengujian reliabilitas tertentu lebih besar dibandingkan dengan batas keputudan reliabilitas. Beberapa pertimbangan dalam menetukan seberapa tinggi seharusnya sebuah reliabilitas:

1. Tingkat pentingnya keputusan.

Apabila keputusan yang diambil berdasarkan skor yang dikumpulkan dari THB mempunyai konsekuensi yang sangat penting bagi siswa maka menuntut THB dengan reliabilitas yang sngat tinggi.

2. Dapat tidaknya keputusan dapat di perbaiki dalam waktu yang cepat.

Dalam tahap awal pengambilan keputusan pendidikan, reliabilitas yang rendah mungkin cukup karena kesalahan pengambilan keputusan dapat diperbaiki segera.

3. Jaminan yang kita butuhkan sehubungan dengan keputusn yang dibuat.

Jaminan yang lebih besar mempersyaratkan reliabilitas yang lebih tinggi.

Pada hakikatnya indeks raliabilitas merupakan korelasi tes dengan tes itu sendiri (rtt) untuk melihat apakah hasil pengukuran yang stabil dan konsisten. Oleh karena indeks reliabiliatas merupakan korelasi hitung maka batas kriteria reliabilitas adalah tabel korelasi. Bila r hitung > r tabel maka kedua skor hasil pengukuran THB berkorelasi signifikan. Signifikan korelasi menunjukan adanya konsistensi sehingga THB telah dapat dikatakan reliabel.

· Kesalahan standar pengukuran

Kalau validitas berhubugan dengan ketepatan THb dalam mengukur hasi belajar yang diinginkan, reliabilitas lebih berhubungan dengan akurasi THB dalam melakukan pengukuran. THB yang mempun mmengukur hasil belajar dengan akurasi dan presisi yang tinggi akan meminimalkan kesalahan THB dalam melakukan pengukuran. THB yang mampu melakukan pengukuran secara akurat dengan tingkat kesalahan pengukuran yang rendah akan memberikan hasil pengukuran yang relatif kosisten dan stabil (reliabel).

Kesalahan standar pengukuran adalah ukuran yang mencerminkan tidak akuratnya skor dari THB yang digunakan untuk mengukur. Semakin tinggi koifisien reliabilitas maka THB semakin akurat dan makin rendah kesalahan standar pengukuran, dan sebaliknya.

Kesalahan standar pengukuran dihitung menggunakan rumus sebagai berikut:

SEM = SD

Keterangan :

SEM = standard error of measurement

SD = standar diviasi

rtt = koefisien reliabilitas.

Misalnya seseorang siswa X memperoleh skor 50 pada THB yang mempunyai koefisien reliabilitas sebesar 0,977 yang diperoleh dari kelompok siswa yang mempunyai standar deviasi 13,51. Bila taraf kepercayaan yang ditentukan 90% (atau taraf signifikasi p= 0,10), berapakah interval keparcayaan terhadap skor murni siswa X?

Untuk menjawab itu di tempuh beberapa langkah:

1. Menghitung kesalahan standar pengukuran (SEM)

SEM = 13,51

= 2,049

2. Mencari nilai Z pada distribusi normal untuk kedua ujung kurva. Oleh karena p= 0,10 maka p kedua ujuang masing-masing p = 0,05. Dengan melihat tabel Z diketahui harga tabel untuk p = 0,05 adalah 1,645.

3. Menghitung interval kepercayaan skor murni responden X. Oleh karena skor yang diperoleh X = 50 dan harga tabel Z = 1,645 maka interval kepercayaan skor murni (true score = T) dapat di hitung sebagai berikkut :

50-(1,645)(2,049)<T<50+ (1,645)(2,049)

46,63 dibulatkan 47<T<53,37 dibulatkan 53

Dari hasil perhitungan dapat diambil kesimpulan sebagai berikut :

1. Walaupun data yang diperoleh dari pengukuran siwa X sebesar 50, namun ada kemungkinan 90% bahwa skor hasil belajar sesungguhnya siswa X beberapa diantara 47 dapai 53. Kemungkinan skor siswa X berada di atas 53 atau di bawah 47 hanyalah 10%.

2. Lebar interval 47 sampai 53 adalah enam interval. Lebar interval menunjukan ketidak cermatan pengukuran. Makin sempit interval maka pengukuran makin cermat dan memuaskan. Sebaliknya, semakin lebar interval maka ukuran makin kurang cermat.

Daftar Pustaka

Aiken, Lewis R (1995). Rating scales and checklist: evaluating behavior, personality and attitude. New York: Jhon wiley & Sons, Inc

Azwar, Saifuddin (1995). Sikap manusia teori dan pengukurannya . Yogyakarta: Pustaka Pelajar

Arikunto, Suharsimi (1995) Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara

Echols, Jhon M dan Shadily, Hassan (1993). Kamus Inggris Indonesia. Jakarta: PT Gramedia

Crocker, Linda dan Algina, James (1986). Intruduction to Classical and Modern Test Theory. Forth Worth: Holt, Rinehart and Winston, Inc.

Jejak Pendidikan

Rabu, 29 Oktober 2014

Validitas dan Reliabilitas Tes Hasil belajar

Tidak ada komentar:

Posting Komentar

Arsip Blog

No	X	Y	X	Y	XY
1	1	1	1	1	1
2	1	0	1	0	0
3	1	1	1	1	1
4	1	1	1	1	1
5	1	1	1	1	1
6	0	0	0	0	0
7	1	1	1	1	1
8	1	1	1	1	1
9	1	1	1	1	1
10	1	1	1	1	1
	9	8	9	8	8

No	X	Y	X	Y	XY
1	1	1	1	1	1
2	1	0	1	0	0
3	1	1	1	1	1
4	1	1	1	1	1
5	1	1	1	1	1
6	0	0	0	0	0
7	1	1	1	1	1
8	1	1	1	1	1
9	1	1	1	1	1
10	1	1	1	1	1
	9	8	9	8	8

No	X	Y	X	Y	XY
1	1	1	1	1	1
2	1	0	1	0	0
3	1	1	1	1	1
4	1	1	1	1	1
5	1	1	1	1	1
6	0	0	0	0	0
7	1	1	1	1	1
8	1	1	1	1	1
9	1	1	1	1	1
10	1	1	1	1	1
	9	8	9	8	8