Pertanyaan yang diajukan:
1. Apa yang dimaksud dengan validitas dan reliabilitas?
2. Jenis validitas dan reliabilitas? Validitas untuk proses riset dan alat ukurnya!
3. Bagaimana cara mengukur validitas dan reliabilitas?
4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?
5. Mengapa perlu ada validitas dan reliabilitas?
6. Kapan validitas dan reliabilitas tidak berlaku?
7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan wawancara?
8. Bagaimana menentukan validitas untuk kegiatan observasi?
9. Kapan sebuah observasi membutuhkan validitas?
10. Kapan sebuah wawancara perlu ditentukan validasinya?
11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan wawancara?
12. Bagaimana cara menggunakan validitas?
13. Apakah perlu mencari reliabilitas kegiatan observasi?
14. Apakah perlu mencari reliabilitas kegiatan wawancara?
15. Bagaimana menghitung reliabilitas dalam observasi?
16. Bagaimana meningkatkan reliabilitas observasi?
17. Kapan observasi perlu ditentukan reliabilitasnya?
18. Apa beda reliabilitas alat tes dengan reliabilitas untuk kegiatan observasi dan wawancara?
19. Bagaimana cara menggunakan reliabilitas?
20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat tes tersebut? Dan bagaimana jika terjadi kebalikannya?

PEMBAHASAN
1. Apa yang dimaksud dengan validitas dan reliabilitas?
Validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah (Azwar, 1997).
Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang reliabel (reliabele). Walaupun reliabilitas mempunyai berbagai nama lain seperti keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang terkandung dalam konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya.

2. Jenis validitas dan reliabilitas? Validitas untuk proses riset dan alat ukurnya!
a. Jenis Validitas
Menurut Sudijono (2009) terdapat berbagai jenis validitas, berikut ini jenis validitas ditinjau dari pengujiannya validitasnya yaitu pengujian validitas secara rasional dan secara konten. Penhelasan untuk masing masing validititas itu adalah sebagai berikut:
Pengujian Validitas Tes Secara Rasional
Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir secara logis.
a. Validitas Isi (Content Validity)
Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau variabel yang hendak diukur.
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Validitas isi adalah yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik, isisnya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahkan pelajaran yang seharusnya diteskan (diujikan).
Misalnya test bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut, pengukuran motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini Dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang sistematis, lebih lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
b. Validitas konstruksi (Construct Validity)
Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk) merupakan yang terluas cakupannya dibanding dengan validasi lainnya, karena melibatkan banyak prosedur termasuk validasi isi dan validasi kriteria.
Validitas konstruksi juga dapat diartikan sebagai validitas yang ditilik dari segi susunan, kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas konstruksi, apabila tes hasil belajar tersebut telalh dapat dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis.
Pengujian Validitas Tes Secara Empirik
Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik. Dengan kata lain, validitas empirik adalah validitas yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan.
a. Validitas ramalan (Predictive validity)
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang. Contohnya apakah test masuk sekolah mempunyai validitas ramalan atau tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila ada, berarti test tersebut mempunyai validitas ramalan.
b. Validitas bandingan (Concurrent Validity)
Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya hubungan yang searah, antara tes pertama dengan tes berikutnya.

b. Jenis-jenis Reliabilitas
1. Reliabiltas Tes Berulang (Test-retest reliability) Reliabiltas tes berulang adalah ukuran reliabilitas yang diperoleh dengan pemberian dua kali tes yang sama selama periode waktu tertentu untuk sekelompok individu. Contoh: Sebuah tes bahasa diberikan kepada siswa. Satu bulan kemudian tes yang sama diberikan pada siswa yang sama. Jika skor keduanya menghasilkan koefisien korelasi tinggi maka tes tersebut memiliki reliabilitas tinggi.
2. Reliabilitas Antar Penilai (Inter-rater atau Inter-observer Reliability) Reliabilitas antar penilai adalah ukuran reliabilitas berdasarkan konsistensi penilaian dua responden berbeda terhadap suatu konstruk, karena belum tentu pengamat manusia menafsirkan jawaban dengan cara yang sama. Contoh: Peneliti meminta tanggapan dua hakim berbeda untuk memutuskan kasus yang sama. Jika kedua hakim memberi tanggapan yang seragam maka instrumen dinyatakan reliabel.
3. Reliabilitas Konsistensi Internal (Internal consistency reliability) Reliabilitas konsistensi internal adalah ukuran reliabilitas berdasarkan evaluasi item-item tes terhadap konstruk yang sama. Ada dua jenis untuk reliabilitas ini yaitu:
o Rata-rata Korelasi Antar Item (Average inter-item correlation) Rata-rata korelasi antar item diperoleh dengan mengambil semua item pada tes dan akhirnya menggunakan rata -rata semua koefisien korelasi tersebut. Dengan kata lain instrumen dibelah sebanyak jumlah item kemudian hasil koefisien korelasi digabung untuk mendapatkan rata-rata. Teknik ini populer dengan Alpha Cronbach.
o Reliabilitas Belah Setengah (Split-half reliability) Reliabilitas belah setengah adalah teknik dengan membelah item tes menjadi dua bagian untuk membentuk dua set item, kemudian skor total masing-masing set item dikorelasikan. Jika koefisien korelasi tinggi maka reliabilitas tinggi.
3. Bagaimana cara mengukurnya validitas dan reliabilitas?
Pekerjaan untuk mencari validitas suatu alat ukur disebut validation. Prinsip dari validation adalah membandingkan hasil-hasil dari pengukuran faktor dengan suatu kriterium, )suatu ukuran yang telah dipandang valid untuk menunjukkan faktor yang dimaksud). Jadi misalnya suatu alat pengukur hendak menyelidiki faktor ketelitian kerja, maka harus diambil lebih dahulu suatu kriterium yang telah dipandang mencerminkan suatu ketelitian kerja. Melalui kriterium itulah kemudian hasil dari pengukuran faktor ketelitian kerja disoroti, Jika hasil pengukuran faktor ketelitian kerja menunjukkan besarnya ketelitian kerja yang sesuai dengan kriterium, maka alat pengukur itu dipandang valid.
Ada dua jenis kriterium ang digunakan untuk menguji kejituan alat pengukur, yaitu :
a. Kriterium luar (external criterion)
Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya : suatu tes tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang sesungguhnya sebagaimana ditunjukkan oleh catatan-catatan hasil kerja atau penilaian pimpinan unit.
b. Kriterium dalam alat (internal criterion)
Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya diambil hasil keseluruhan pengukuran atau total score sebagai kriteriumnya. Misalnya, kita ingin mengukur intelegensi (yang terdiri dari faktor-faktorl; daya analisa, daya klarifikasi, daya ingatan, daya pemahaman, daya kritik dan sebagainya), maka untuk menguji apakah sekelompk item benar-benar mengukur daya analisa, misalnya, jawaban-jawaban terhadap item daya analisa dicocokkan dengan hasil tes secara keseluruhan atau total score-nya. Antara nilai total harus terdapat korelasi yang positif (tinggi dan cukup meyakinkan). Kecocokkan antara hasil-hasil dari item yang disangka mengukur suatu faktor dengan suatu kriterium yang dipandang telah valid disebut factorial validity atau validitas faktor, di mana besar kecilnya validitas faktor tergantung kepada besar kecilnya kecocokan itu.
Cara pengukuran reliabilitas
Tiga tehnik pengujian realibilitas instrument antara lain :
a. Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).
b. Teknik Ulang (Test Re-test)
Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.
4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?
Cara meningkatkan atau mengembangkan validitas dan reliabilitas
1. Mencatat bebas hal-hal penting serinci mungkin (setting,partisipan ataupun hal-hal terkait).
2. Mendokumentasikan secara lengkap dan rapi data yang terkumpul, proses pengumpulan data maupun strategi analisisnya.
3. Menyertakan partner saat observasi untkmenghindari subyektifitas
4. Melakukan pengecekan dan pengecekan kembalidata,menguji kemungkinan dugaan-dugaan yg berbeda.
Cara meningkatkan reliabilitas
1. Mengonsep satu variabel dengan jelas.
2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling tepat yang mungkin diperoleh.
4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi konseptual.
5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.
5. Mengapa perlu ada validitas dan reliabilitas?
Jika kita kembali ke definisi validitas, maka dapat disimpulkan bahwa validitas mutlak diperlukan oleh sebuah alat ukur atau alat tes agar tujuan pengukuran relevan dengan data yang diperlukan atau diperoleh. Sebagai contoh, sebuah timbangan badan, dikatakan memiliki validitas jika dapat mengukur berat badan manusia secara akurat. Keakuratan timbangan badan tersebut sebelumnya harus diuji terlebih dahulu, melalui proses terra timbangan oleh Badan Metrologi. Uji validitas tersebut mutlak diperlukan oleh timbangan agar orang yang menggunakan merasa yakin bahwa ukuran 1 kg pada timbangan benar-benar valid mengukur 1 kg berat benda.
Sedangkan reliabilitas diperlukan untuk mengetahui sejauhmana hasil suatu pengukuran dapat dipercaya. Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Relatif sama, berarti tetap adanya toleransi terhadap perbedaan-perbedaan kecil diantara hasil beberapa kali pengukuran. Bila perbedaan itu sangat besar dari waktu ke waktu maka hasil pengukuran tidak dapat dipercaya dan dapat dikatakan tidak reliabel.(Azwar, 1997) Jika kita kembali menggunakan contoh timbangan badan, maka reliabilitas timbangan dapat diketahui dengan cara menggunakan timbangan badan tersebut pada beberapa orang dan beberapa kali percobaan untuk satu orang. Kalau hasil timbangan tersebut sama atau hanya memiliki perbedaan kecil saat pengukuran, maka timbangan tersebut dapat dinyatakan reliabel.
6. Kapan validitas dan reliabilitas tidak berlaku?
Validitas menjadi tidak berlaku ketika validitas sebuah alat ukur digunakan untuk melihat validitas alat ukur lainnya, maka validitas tersebut menjadi tidak berlaku. Hal ini disebabkan tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Sedangkan reliabilitas menjadi tidak berlaku pada dua kondisi. Yang pertama, alat ukur tersebut digunakan untuk mengukur populasi atau sampel yang berbeda dengan rancangan alat ukur itu. Ini disebut sampling error, mengacu kepada inkonsistensi hasil ukur karena digunakan ulang pada kelompok individu yang berbeda. Contoh timbangan badan tadi, menjadi tidak reliabel jika yang ditimbang adalah monyet, bukan manusia. Sedangkan yang kedua, reliabilitas menjadi tidak berlaku jika terjadi kesalahan pengukuran atau error of measurement. Alat ukur yang dipakai tidak konsisten dalam mengukur. Timbangan badan, menjadi tidak reliabel ketika mengukur berat badan orang yang sama beberapa kali namun menunjukkan hasil yang berbeda-beda dan perbedaan tersebut cukup besar. Misalkan: hasil timbangan pertama pada si A, 60 kg. Timbangan kedua, 58 kg dan timbangan ketiga 60,5 kg. Dari hasil timbangan tersebut, dapat kita simpulkan bahwa alat timbangan badan itu tidak reliabel.
7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan wawancara?
Validitas untuk alat tes berkaitan dengan ketepatan dan kecermatan alat tes tersebut dalam melakukan fungsi tes atau fungsi ukurnya. Menurut buku Standards, yang ditulis oleh Asosiasi Psikolog Amerika (APA), validitas mengacu pada derajat dimana bukti dan teori menyokong interpretasi dari skor tes dan mengacu pada tujuan tes. Validitas adalah hal yang paling mendasar dalam pengembangan dan evaluasi tes. Proses validasi meliputi akumulasi, membuktikan tujuan dari evaluasi tersebut, bukan terhadap test itu sendiri. Pada alat tes biasanya validitas akan dihitung secara statistik dan dalam bentuk rumusan angka.
Sedangkan validitas untuk kegiatan observasi dan wawancara berkaitan dengan konsep yang digunakan untuk mendasari tujuan observasi dan wawancara itu sendiri. Sebelum seseorang melakukan kegiatan observasi dan wawancara, ia harus mendefinisikan konsep atau teori yang akan dipakai sebagai acuan kerangka konsepnya sehingga kegiatan observasi dan wawancara yang dilakukan memiliki acuan yang jelas. Hasil dari observasi dan wawancara dapat dijadikan referensi yang akurat untuk membuat deskripsi tentang orang, situasi atau kejadian. Validitas observasi dan wawancara tidak dihitung secara statistik, namun cukup dengan menguraikan konsep atau teori menjadi beberapa indikator.
8. Bagaimana menentukan validitas untuk kegiatan observasi?
Ada 2 cara menentukan validitas observasi, yaitu: menggunakan dasar teori atau konsep kemudian di turunkan menjadi beberapa aspek atau indikator konsep. Yang kedua, menggunakan perbandingan antar perilaku. Pada cara pertama, observer harus menentukan teori atau konsep apa yang akan digunakan sebagai acuan observasi. Konsep atau teori itu kemudian diturunkan menjadi beberapa indikator yang dipakai untuk menjadi tolok ukur operasional konsep tersebut. Sedangkan cara kedua adalah membandingkan perilaku subjek pada berbagai situasi. Apakah perilaku inatensi, misalnya, muncul di kelas, apakah muncul juga saat ia berada di rumah, apakah muncul juga saat ia sedang mengerjakan tugas di tempat les. Dengan membandingkan kemunculan perilaku dari hasil observasi tersebut akan didapatkan validitas observasi yang disebut concurrent validity.
9. Kapan sebuah observasi membutuhkan validitas?
Pada setiap kegiatan observasi atau pengamatan sangat perlu untuk memiliki instrumen observasi yang valid. Hal ini dikarenakan indera yang digunakan dalam pengamatan yakni mata dan telinga memiliki keterbatasan. Rahayu dan Ardani (2004) menyatakan bahwa keterbatasan indera timbul terutama dari objek yang dihadapi. Kebanyakan objek-objek penyelidikan adalah objek-objek yang kompleks, memiliki unsur yang banyak, segi yang berliku-liku atau dimensi yang majemuk. Oleh karena itu kegiatan observasi membutuhkan instrumen yang valid agar instrumen tesebut benar-benar dapat mengukur target perilaku dalam kegiatan observasi. Sattler (2002) menjelaskan bahwa dalam pelaksanaan observasi sering ditemui berbagai masalah. Pertama, sulitnya untuk mendapatkan sampel dan representatif perilaku yang tepat dalam waktu singkat. memperoleh sampel dan representatif perilaku yang tepat akan memerlukan pengambilan sampel dalam berbagai jenis situasi, dan ini jarang dilakukan. Kriteria validasi meliputi penilaian dari orang lain yang akrab dengan subjek penelitian dan observasi dalam situasi eksperimental. Tapi kriteria ini tidak mutlak dan tidak menawarkan bukti keabsahan. kesulitan lebih lanjut muncul ketika dua indeks yang dimaksudkan untuk mengukur perilaku yang sama bukanlah kesepakatan. ukuran mana yang valid atau representatif? karena perilaku adalah variabel, sangat mungkin kedua ukuran ini adalah akurat, meskipun langkah-langkah kriteria menunjukkan kesepakatan yang buruk.
10. Kapan sebuah wawancara perlu ditentukan validasinya?
Instrumen yang digunakan dalam sebuah wawancara seharusnya memiliki validitas yang baik. Rahayu dan Ardani (2004) mengungkapkan bahwa validitas yang baik merujuk pada objektivitas. Artinya, variabel-variabel dalam wawancara yang telah ditetapkan oleh peneliti harus berdasarkan teori-teori yang telah mapan. Namun objektivitas dalam kegiatan wawancara bersifat objectivied subjectivities. Artinya subjektif menurut peneliti (teori yang ada), tetapi objektif menurut subjek yang diteliti. Hal ini dimungkinkan karena realitas sosial dalam penelitian naturalistik berada di alam imajinasi pikiran kebanyakan manusia yang merupakan gugusan subjektivitas awam yang tidak pernah diuji kebenarannya, dan objektif menurut kaidah-kaidah keilmuan atau logika. Namun betapapun subjektifnya, hal tersebut sesungguhnya adalah subjektivitas unik yang justru harus ditempatkan sebagai objek kajian ilmu-ilmu sosial yang utama.
11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan wawancara?
Validitas dalam kegiatan observasi dan wawancara pada pengukuran psikologi perlu untuk dilakukan karena subjek pengukurannya adalah manusia. Untuk mengungkap aspek-aspek atau variabel-variabel dari keadaan psikologis manusia, diperlukan instrumen observasi dan wawancara yang reliabel dan valid agar kesimpulan penelitian tidak keliru dan dapat memberikan gambaran yang tepat mengenai subjek penelitian (Azwar, 1992).
12. Bagaimana cara menggunakan validitas?
Rahayu dan Ardani (2004) menjelaskan bahwa validitas menunjukkan sejauh mana suatu alat ukur dapat mengukur apa yang hendak diukur. Dalam kegiatan observasi ada beberapa jenis validitas yang dapat digunakan, yaitu
a. Face validity adalah bagaimana kelihatannya suatu alat pengukur benar-benar menukur apa yang hendak diukur. Misalnya untuk mengukur kemampuan sebagai seorang supir, seorang observee harus disuruh mengendarai mobi. Tetapi, bila pengukuran kemampuan mengendarai mobil dilakukan dengan ujian tertulis tentang teknik mengendarai mobil, maka alat pengukur tesebut kurang memiliki face validity.
b. Content validity adalah sejauh mana isi alat ukur tersebut mewakili semua aspek yang dianggap sebagai aspek kerangka konsep. Data harus mencerminkan cir-ciri yang telah ditentukan yaitu apa saja yang akan diungkap/diukur. Contohnya bila seorang penelitia infin mengukur keikutsertaan dalam program KB dengan menanyakan metode kontrasepsi yang dipakai. Bila aspek yang diamati tidak mencakup semua metode kontrasepsi, maka alat ukur tersebut tidak memiliki validitas isi.
c. Predicty validity adalah alat pengukur yang dibuat oleh peneliti seringkali dimaksudkan untuk memprediksi apa yang akan terjadi di masa yang akan datang. Contonya ujian seleksi masuk perguruan tinggi. Ujian tersebut merupakan upaya untuk memprediksi apa yang aan terjadi di masa yang akan datang. Peserta yang lulus ujian dengan nilai baik diprediksikan akan mengikuti pelajaran di perguruan tinggi dengan sukses. Soal ujian masuk tersebut dikatakan memiliki validitas prediktif, apabila ada korelasi yang tinggi antara nilai ujian masuk dengan prestasi belajar setelah menjadi mahasiswa.
d. Construct validity adalah kerangka suatu konsep. Misalnya, untuk mengukur status ekonomi responen dengan menggunakan lima komponen status ekonomi, yakni penghasilan perbulan, pengeluaran perbulan, pemilikan barang, porsi penghasilan yang digunakan untuk rekreasi, dan kualitas rumah. Apabila ada konsistensi antara komponen-komponen konstruk yang satu dengan yang lain maka konstruk tersebut memiliki validitas.
e. Concurrent validity dilakukan dengan mengobservasi perilaku dan membandingkannya dengan perilaku lain. Misalnya perilaku di sekolah sama dengan perilaku di luar kelas (menunjukkan agresivitas).
Selanjutnya validitas dalam kegiatan wawancara
a. Validitas konstruk. penelitian kualitatif dengan metode observasi dan wawancara tidak terlepas dari aktivitas melakukan konstruksi sosial. Misalnya, orang yang selalu memakai peci dikonstruk peneliti sebagai orang yang alim. Konstruksi semacam itu memiliki banyak kelemahan. Oleh karena itu, perlu diperhatikan beberapa hal, yaitu:
• Dalam pengumpulan data, peneliti harus menggunakan multi sumber bukti.
• Peneliti harus membangun rangkaian bukti antara satu data dengan data lain.
• Agar peneliti meminta orang yang diwawancarai meninjau ulang draft laporan yang disusun.
b. Validitas internal. Hal ini dilakukan pada tahap analisis data. Validitas internal ini meliputi hal-hal berikut:
• Membuat pola penjodohan dengan analisis sebab-akibat atau aksi reaksi atau pengaruh-mempengaruhi.
• Peneliti hendaknya mengerjakan penyusunan kesplanasi; maksudnya apakah konstruksi yang dibuat berdasarkan data yang diterima itu dapat dipertanggungjawabkan.
• Peneliti hendaknya membuat analisis deret waktu dari peristiwa-peristiwa atau fenomena-fenomena yang terjadi.
c. Validitas eksternal. Dalam melakukan validitas ini, hendaknya peneliti menggunakan logika replikasi. Artinya seandainya penelitian yang sama dilakukan oleh orang lain dengan menggunakan pendekatan yang sama, niscaya hasilnya akan sama atau hampir sama.

13. Apakah perlu mencari reliabilitas kegiatan observasi?
Mencari reliabilitas dalam kegiatan observasi itu perlu, dimana reliabilitas observasi adalah keajegan apa yang diobservasi. Agar suatu pengukuran observasi dapat dipercaya, maka idealnya hasil observasi bila diuji kembali oleh orang lain baik di lain waktu maupun sekarang maka hasilnya relatif sama.

14. Apakah perlu mencari reliabilitas kegiatan wawancara?
Menurut Neuman (2007), metode wawancara menjadi ciri khas dari penelitan kualitatif. reliabilitas dengan pendekatan kualitatif lebih menekankan kepada keajegan hasil jawaban yang dimunculkan oleh subjek. Namun berbeda dengan pendekatan kuantitatif, reliabilitas pada kualitatif lebih bersifat fleksibel dan berkembang. Sehingga jika pada pendekatan kualitatif didapatkan data yang berbeda, tidak serta merta disimpulkan bahwa reliabilitasnya rendah tapi justru menjadi salah satu bentuk memperoleh data yang kaya atau lengkap.
15. Bagaimana menghitung reliabilitas dalam observasi?
Cara mendapatkan reliabilitas observasi adalah berdasarkan “kesepakatan observer,” Reliabilitas berarti, apabila dua observer sepakat dalam hasil observasi (Sukadji, 2000). Rumus “kesepakatan” juga bisa untuk menghitung hasil “dua kali” observasi yang dilakukan oleh satu orang observer (Sukadji, 2000).
Rumus “Persentase Kesepakatan” sebagai berikut :
Interval Recording
-Agreement of total observation (A tot)→ total ke dua observer ‘sama-sama setuju’ baik X maupun O
– Agreement of occurence observation (A occ) → sama-sama setuju ‘ada peristiwa’ observasi (X)
– Agreement of nonoccurence observation (A non) →sama-sama setuju ‘tidak ada peristiwa’ observasi (O)
Event Recording
Adalah kejadian yang tegas mulai dan berakhirnya kegiatan obesrvasi. Pencatatan bisa dengan check list, mechanical devices, dan lain-lain. Dalam observasi kelas, rincian perilaku dapat ditulis dalam bentuk daftar event yang dapat dihitung bila terjadi perilaku yang diinginkan.
Dalam observasi, reliabilitas dan validitas dipengaruhi oleh faktor-faktor antara lain :
a. Observer
Banyak sekali kesalahan yang bersumber dari kualitas pribadi observer yang dapat digolongkan sebagai “kecondongan” (bias).
1) Kesalahan yang berkaitan dengan kualitas pribadi observer, antara lain :
a) Central tendency
Observer lebih sering menggunakan kategori yang di tengah dalam skala rating daripada kategori tepi, sehingga dalam prosesnya cenderung underestimasi perilaku yang intens dan overestimasi perilaku yang lemah.
b) Leniency (kemurahan)
Observer cenderung membuat penilain yang cenderung ke arah “baik” terhadap subjek.
c) Efek primacy (kesan pertama)
Observer membiarkan kesan pertama mendistorsikan kesan atau penilaiannya kemudian.
d) Halo effect
Observer membuat penilaian berdasar kesan umum subjek atau berdasar perilaku subjek yang paling mencolok.
e) Teori pribadi
Observer menyesuaiakn observasi ke asumsi teori pribadi.
f) Nilai pribadi
Observer menyesuaikan observasi ke harapan, nilai, dan minat pribadi.
g) Overestimasi perilaku yang hampir-hampir tidak dikenali ada pada diri observer sendiri. Misalnya, observer overestimasi volume suara subjek sebab observer sendiri tidak mengenali bahwa suaranya terlalu rendah volumenya.
h) Kesalahan logika
Observer membuat penilaian yang serupa terhadap sifat-sifat subjek yang kelihatannya secara logika saling terkait.
i) Kesalahan kontras
Pada sifat khusus, observer menilai subjek jauh lebih berbeda dengan diri observer sendiri daripada kenyataannya.
j) Kesalahan proksimitas
Observer menilai serupa sifat-sifat tertentu karena bentuk penilaian membuat sifat-sifat itu berdekatan dalam waktu atau letak.
k) Pengaruh pribadi
Tanpa diketahui oleh observer sendiri, karakteristik diri observer (usia, jenis, kelamin, ras, dan status sosial) mempengaruhi penilaian perilaku subjek.
l) Ketidakstabilan penilaian observer
Kriteria penilaian yang dipakai oleh observer berubah bersama waktu, akibat ada dan tidaknya perilaku karena kelelahan, atau belajar, atau penyebab lainnya.
m) Terlewat
Observer alpa mencatat perilaku yang muncul.
n) Commision
Observer keliru kode suatu perilaku.
o) Efek harapan
Harapan observer mempengaruhi pencatatan, atau observer mengharapkan sesuatu terjadi dan mengkomunikasikan harapan ini kepada subjek.
p) Reaktivitas observer
Observer berubah pencatatan perilakunya karena ia sadar diamati.
q) Isyarat nonverbal
Observer dengan tidak sengaja memberi isyarat kepada subjek sehingga mendukung perilaku tertentu pada subjek.
2) Ketidakstabilan Penilaian Observer
Bila observasi berlangsung lama, observer mungkin menunjukkan tanda-tanda kelelahan, lupa dan motivasinya menurun. Misalnya, pada saat permulaan menggunakan standar tertentu untuk menilai suara bisikan atau vokalisasi singkat, tetapi kemudian berubah standarnya, ketidakstabilan hal ini mungkin saja terjadi, walaupun telah ada persetujuan mengenai definisi oprasional perilaku yang diamati.
3) Kesulitan dalam Mengkodekan Perilaku
Kategori global, seperti perilaku “off-task” atau perilaku tidak patut (innappropriate behavior) membutuhkan penyimpulan tingkat tinggi dibanding kategori spesifik, seperti memukul, atau meninggalkan tempat duduk. Meskipun diusahakan sebaik-baiknya mendefinisikan perilaku dengan cermat, beberapa perilaku memang sulit dikategorikan. Jadi, kode observasi menuntut pertimbangan yang masak di pihak observer.
4) Memilih Waktu dan Saat yang Tepat
Menentukan waktu yang tepat munculnya suatu kejadian bukanlah semudah yang dibayangkan. Misalnya, untuk mengobservasi perilaku menolak dan memulai makan pada anak. Sulit untuk menentukan waktu kapan saat yang tepat anak mulai menolak memulai makan. Selain itu, unit waktu yang dipilih oleh observer mungkin tidak dapat menggambarkan dengan tepat peta kejadian perilaku.
16. Bagaimana meningkatkan reliabilitas Observasi?
Adanya kelemahan-kelemahan yang menyebabkan reliabilitas pengukuran menurun (sehingga validitasnya juga menurun), membuat kita waspada untuk menghindarinya. Beberapa petunjuk praktis, antara lain :
a. Observer hendaknya memahami benar-benar teknik-teknik pencatatan, manual maupun instrumental. Pastikanlah dalam rancangannya perilaku-perilaku kritis didefinisikan dengan jelas, tegas dan cermat.
b. Sebelum melaksanakan observasi, periksalah dulu peralatan-peralatan pengumpul data.
c. Observer perlu latihan sampai mahir sebelum turum ke lapangan.
d. Kumpulkan data dengan mengobservasi subjek dalam berbagai situasi dan waktu, terutama bila yang diobersevasi kelompok, atau untuk mendapatkan norma.
e. Temukan kecondongan (bias), kelemahan-kelemahan, yang kita miliki sebagai observer, dan kembangkan ketrampilan pemahaman diri dan evaluasi diri yang kritis.
f. Kembangkan skeptisisme yang sehat terhadap laporan yang telah ada mengenai perilaku subjek, agar observasi yang kita lakukan dapat seobjektif mungkin.
g. Menunda asumsi dan spekulasi mengenai arti dan implikasi perilaku subjek yang diamati selagi pengambilan data.
h. Bila pengamatan telah selesai, pertimbangkanlah faktor-faktor yang meyulut dan memelihara perilaku subjek, serta tanggapan-tanggapan orang lain yang ada di dalam setting subjek atas perilaku subjek tersebut.
i. Secara periodik bandingkan hasil pengamatan dengan pengamat lain yang menggunakan sistem penyekoran yang sama.
j. Secara teratur pencatatan harus “dikalibrasi” yaitu dengan mencocokkan lagi dengan potokol standar.
k. Ikuti teori-teori dan test-retest mutakhir dalam bidang observasi.
l. Hindari kekeliruan-kekeliruan umum berkenaan dengan observasi sebagaimana telah disebut terlebih dahulu.
17. Kapan observasi perlu ditentukan reliabilitasnya?
Reliabilitas observasi perlu dilakukan bila data yang dihasilkan berbentuk data kuantitatif. Pengukuran reliabilitas dapat dilakukan untuk melihat hasil observasi antar observer 1 dengan observer yang lain (reliabilitas interrater). .
18. Apa beda reliabilitas alat tes dengan reliabilitas untuk kegiatan observasi dan wawancara?
Perbedaan penerapan reliabilitas dalam alat tes dan obserasi/wawancara dapat dijelaskan dengan perbedaan pendekatan kuantitatif (untuk alat tes) dan pendekatan kualitatif (observasi/wawancara). Secara sederhana dapat dikatakan bahwa reliabilitas pada pendekatan kuantitatif bersifat tetap dan statis sedangkan reliabilitas pengukuran dengan pendekatan kualitatif bersifat berkembang dan tumbuh bersama kedekatan antara observer dengan observee (Neuman, 2007).
19. Bagaimana cara menggunakan reliabilitas?
Kita dapat menggunakan nilai reliabilitas untuk menunjukkan tingkat kepercayaan terhadap alat ukur yang sudah kita buat. Nilai reliabilitas berkisar pada nilai 0-1, dimana semakin mendekati 1 maka dapat dikatakan alat ukur tersebut semakin dapat dipercaya. Dipercaya disini dimaksudkan bahwa suatu alat tes apabila dilakukan tes ulang atau diadministrasikan oleh tester lain maka akan keluar nilai yang relatif tetap (ajeg).
20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat tes tersebut? Dan bagaimana jika terjadi kebalikannya?
Validitas dan reliabilitas bersifat saling melengkapi namun terkadang juga dapat bersifat bertolak belakang (Neuman, 2007). Dalam suatu contoh misalnya ada suatu alat ukur yang memiliki validitas tinggi namun memiliki reliabilitas rendah, hal ini dapat terjadi dalam pengukuran dengan pendekatan kualitatif. Misalnya konstrak yang diukur merupakan suatu konstrak yang sangat abstrak yaitu “alienasi” yang digali melalui metode wawancara, hal ini mungkin dapat dikatakan memiliki validitas yang tinggi namun reliabilitas yang rendah karena tergantung pada bagaimana peneliti menggunakan instrumen penelitian.
Contoh lain misalnya suatu alat ukur yang memiliki reliabilitas yang tinggi namun validitasnya rendah. Berdasarkan pernyataan tersebut dapat dikatan bahwa suatu alat ukur memiliki keajegan dalam mengukur namun kurang tepat dalam mengukur apa yang hendak diukur. untuk memudahkan pembahasan ini penulis mengutip gambar dari Neuman (2007) sebagai berikut:

Berdasarkan gambar diatas dapat dilihat bahwa ketika ketika suatu alat tes memiliki reliabilitas yang tinggi namun validitas rendah tidak dapat mengenai sasaran terhadap apa yang ingin diukur. Berdasarkan penjabaran tersebut maka dapat dikatakan bahwa ketika suatu alat tes memiliki reliabilitas yang tinggi namun validitas yang rendah maka alat ukur itu memiliki kualitas yang rendah. Namun sebaliknya, jika suatu alat ukur valid maka kemungkinan besar reliabilitasnya akan dapat mengikuti menjadi baik juga. Secara sederhana dapat diakatakan bahwa suatu alat ukur yang valid akan cenderung memiliki reliabilitas yang tinggi namun alat ukur yang memiliki reliabilitas yang tinggi belum tentu valid.

DAFTAR PUSTAKA
Azwar, S. (1992). Reliabilitas dan Validitas. Yogyakarta: Penerbit Sigma Alpha.
Azwar, S. (1997). Reliabilitas dan Validitas(Ed. 3). Yogyakarta: Pustaka Pelajar.
Louis, J. (2011). Validitas dan reliabilitas. Diakses pada tanggal 11 November 2014 dari http://jeffy-louis.blogspot.com/2011/02/validitas-dan-reliabilitas.html
Neuman, W. L., (2007). Basic Social Research Methods: Qualitative & Quantitative Approachs (2ed). Boston: Allyn & Bacon.
Rahayu, I.T. dan Ardani, T.A. (2004). Observasi dan Wawancara. Malang: Bayumedia publishing.
Sattler, J.M. (2002). Assessment of Children. California: Penerbit Sattler.
Sudijono, A. (2009). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Sukadji, S. (2000). Psikologi pendidikan dan psikologi sekolah (Direvisi dan Dilengkapi). Depok: Universitas Indonesia.