Khi mọi người nói về kiểm tra tâm lý, họ thường hỏi liệu thử nghiệm có hợp lệ hay không. Chính xác điều này có nghĩa là gì? Hiệu lực là thước đo mức độ thử nghiệm đo lường những gì nó yêu cầu để đo lường.
Đánh giá tâm lý là một phần quan trọng của cả nghiên cứu thực nghiệm và điều trị lâm sàng. Một trong những mối quan tâm lớn nhất khi tạo ra một bài kiểm tra tâm lý là liệu nó có thực sự đo lường những gì chúng ta nghĩ rằng nó đang đo lường hay không.
Ví dụ, một bài kiểm tra có thể được thiết kế để đo lường một đặc điểm tính cách ổn định nhưng thay vào đó đo lường cảm xúc tạm thời được tạo ra bởi các điều kiện tình huống hoặc môi trường. Một thử nghiệm hợp lệ đảm bảo rằng các kết quả là một sự phản ánh chính xác của đánh giá kích thước đang trải qua.
Vì vậy, nó có nghĩa là gì cho một thử nghiệm có giá trị?
Hiệu lực là mức độ thử nghiệm đo lường những gì nó yêu cầu để đo lường. Điều quan trọng là một thử nghiệm phải có hiệu lực để các kết quả được áp dụng và giải thích một cách chính xác.
Hiệu lực không được xác định bởi một thống kê duy nhất, mà bởi một cơ quan nghiên cứu chứng minh mối quan hệ giữa thử nghiệm và hành vi mà nó dự định đo lường. Có ba loại hiệu lực:
1. Hiệu lực nội dung
Khi thử nghiệm có giá trị nội dung, các mục trên thử nghiệm thể hiện toàn bộ phạm vi của các mục có thể mà thử nghiệm sẽ bao gồm. Câu hỏi kiểm tra cá nhân có thể được rút ra từ một nhóm lớn các mục bao gồm một loạt các chủ đề.
Trong một số trường hợp, khi thử nghiệm đo lường một đặc điểm khó xác định, một thẩm phán chuyên gia có thể đánh giá mức độ phù hợp của mỗi mục. Bởi vì mỗi thẩm phán dựa trên đánh giá của họ về ý kiến, hai thẩm phán độc lập đánh giá thử nghiệm một cách riêng biệt. Các mục được đánh giá là có liên quan chặt chẽ bởi cả hai thẩm phán sẽ được đưa vào bài kiểm tra cuối cùng.
2. Giá trị liên quan đến tiêu chí
Một thử nghiệm được cho là có hiệu lực liên quan đến tiêu chí khi thử nghiệm đã chứng minh hiệu quả của nó trong việc dự đoán tiêu chí hoặc chỉ số của một cấu trúc - ví dụ, khi một chủ nhân thuê nhân viên mới dựa trên các thủ tục tuyển dụng bình thường như phỏng vấn, giáo dục và kinh nghiệm. Phương pháp này chứng minh rằng những người làm tốt bài kiểm tra sẽ làm tốt công việc và những người có điểm thấp trong bài kiểm tra sẽ làm việc kém.
Có hai loại giá trị tiêu chí khác nhau:
- Đồng thời Hiệu lực xảy ra khi các tiêu chuẩn đo được thu được cùng một lúc với điểm kiểm tra. Điều này cho thấy mức độ mà điểm kiểm tra ước tính chính xác trạng thái hiện tại của một cá nhân liên quan đến tiêu chí. Ví dụ, trên một thử nghiệm đo lường mức độ trầm cảm, thử nghiệm sẽ được cho là có giá trị đồng thời nếu nó đo mức độ trầm cảm hiện tại của người thử nghiệm.
- Giá trị dự đoán xảy ra khi các số đo tiêu chí thu được tại một thời điểm sau khi thử nghiệm. Ví dụ về thử nghiệm có hiệu lực dự đoán là các bài kiểm tra nghề nghiệp hoặc năng khiếu , rất hữu ích trong việc xác định ai có khả năng thành công hoặc thất bại trong một số môn học hoặc nghề nghiệp nhất định.
3. Xây dựng hiệu lực
Một thử nghiệm có giá trị xây dựng nếu nó thể hiện mối liên hệ giữa các điểm kiểm tra và dự đoán của một đặc điểm lý thuyết.
Các bài kiểm tra thông minh là một ví dụ về các công cụ đo lường nên có giá trị xây dựng. Một bài kiểm tra tình báo hợp lệ sẽ có thể đo lường chính xác cấu trúc của thông minh hơn là các đặc điểm khác như bộ nhớ hoặc trình độ học vấn.
Về cơ bản, giá trị nội dung xem xét liệu một thử nghiệm có bao gồm đầy đủ các hành vi tạo nên cấu trúc đang được đo lường hay không. Quy trình ở đây là xác định các nhiệm vụ cần thiết để thực hiện công việc như nhập, thiết kế hoặc khả năng thể chất. Để chứng minh tính hợp lệ của nội dung của quy trình lựa chọn, các hành vi được trình bày trong lựa chọn phải là mẫu đại diện cho các hành vi của công việc.
Hiệu lực mặt
Một phương pháp khác hiếm khi được sử dụng bởi vì nó không phải là rất phức tạp là giá trị mặt. Nó chỉ dựa trên sự xuất hiện của các biện pháp và những gì nó được cho là để đo lường, nhưng không phải những gì các thử nghiệm thực sự biện pháp.
Tính hợp lệ của khuôn mặt là một trong những biện pháp hiệu lực cơ bản nhất. Về cơ bản, các nhà nghiên cứu chỉ đơn giản là lấy tính hợp lệ của bài kiểm tra theo mệnh giá bằng cách xem liệu một bài kiểm tra có xuất hiện để đo biến mục tiêu hay không. Ví dụ, trên một thước đo của hạnh phúc, thử nghiệm sẽ được cho là có giá trị mặt nếu nó thực sự đo lường mức độ hạnh phúc.
Rõ ràng, tính hợp lệ của khuôn mặt chỉ có nghĩa là thử nghiệm có vẻ như nó hoạt động. Nó không có nghĩa là thử nghiệm đã được chứng minh là có hiệu quả. Tuy nhiên, nếu biện pháp này có vẻ hợp lệ tại thời điểm này, các nhà nghiên cứu có thể điều tra thêm để xác định xem thử nghiệm có hợp lệ hay không và nên được sử dụng trong tương lai.
Về cơ bản, tính hợp lệ của khuôn mặt là liệu một thử nghiệm có vẻ như để đo lường những gì nó được cho là để đo lường. Nó liên quan đến việc kiểm tra như là giá trị khuôn mặt.
Một cuộc khảo sát yêu cầu những người mà ứng cử viên chính trị mà họ dự định bỏ phiếu sẽ được cho là có giá trị cao. Mục đích của bài kiểm tra rất rõ ràng, ngay cả với những người không quen thuộc với tâm lý học.
Một thử nghiệm phức tạp được sử dụng như là một phần của một thử nghiệm tâm lý mà nhìn vào một loạt các giá trị, đặc điểm và hành vi có thể được cho là có giá trị mặt thấp. Mục đích chính xác của bài kiểm tra là không rõ ràng ngay lập tức, đặc biệt là cho những người tham gia.
Rõ ràng, trong khi tính hợp lệ của khuôn mặt có thể là một công cụ tốt để xác định liệu một thử nghiệm có đo lường những gì nó dự định để đo lường không, có tính hợp lệ của khuôn mặt không có nghĩa là thử nghiệm thực sự hợp lệ. Đôi khi một thử nghiệm có vẻ như nó đang đo lường một điều, trong khi nó thực sự là đo lường cái gì khác hoàn toàn.