Психометрические критерии тестов: валидность и ее типы

1 Понятие валидности

2 Типы валидности

К числу основных критериев оценки психодиагностических методик относится надежность и валидность. Большой вклад в разработку этих понятии внесли зарубежные психологи (А. Анастази, Е. Гизелли, Дж. Гилфорд, Л. Кронбах, Р. Торндайк и Е. Хаген и др.).

В критерии качества теста наряду с репрезентативностью (фр. показательностью – свойством выборки стандартизации представлять характеристики всей популяции) относятся валидность и надежность.

1 Валидность (от англ. valid – пригодный). По А. Анастази, валидность – критерий качества теста, указывающий, «что тест измеряет и насколько хорошо он это делает». Русскоязычными синонимами валидности являются достоверность, обоснованность, адекватность. Чем валиднее тест, тем лучше в нем отображается то качество(свойство), ради которого он создался. Н-р, валидность измерения интеллекта зависит от теоретического(авторского) понятия «интеллект», от состава тестовых задач, соответствующей теоретической концепции, от эмпирических критериев (стаж, образование, профессия и т.д.).

2 Выделяются два типа валидности: непосредственная (или первичная) и производная (или вторичная).

Внутри непосредственной валидности выделяют:

а) внешнюю валидность. Ее наличие означает, что впечатление, которое создается у неспециалистов при знакомстве со стимульным материалом и внешней стороной процесса тестирования, соответствует объявленному содержанию теста. Внешняя валидность может находиться в разных отношениях к подлинному психологическому содержанию теста. В одних случаях (например, при тестировании умственных способностей) внешняя валидность соответствует этому содержанию. В других случаях (в личностных тестах) она помогает маскировать подлинное содержание теста – испытуемый должен поверить в другое, мнимое содержание, указанное в инструкции. Тем самым предупреждается возникновение установки на выдачу фальсифицированных, в том числе социально нормативных ответов.

б)имманентная (внутренняя, содержательная) валидность.Валидизация производится на основе применения «внутренних» критериев. В качестве таковых выступают признаки, указанные в определении психического свойства, отражающегося в содержании теста. Наличие этих (и только их) признаков устанавливается путем анализа всех основных компонентов теста (стимульного материала, процедуры тестирования, системы выставления «сырых» баллов). При этом не используются какие-либо сложные математико-статистические процедуры, а разработчик ограничивается наблюдением за поведением испытуемых, их интервьюированием, оценками экспертов, выполняющих данный тест.

Производная, или вторичная валидность характеризуется сопоставлением тестовых методик с каким-либо внешним критерием:

а) оценочная валидность основана на вычислении коэффициента корреляции между оценками по тесту и показателями оценочных суждений (рейтинга) экспертов. В качестве экспертов выступают лица, имеющие достаточно длительное и тесное общение с испытуемыми.

б) конструктивная валидность указывает на то, что здесь речь идет о теоретической конструкции, о конструкте, посредством которого результаты тестов могут быть проверены на валидность. Значение конструктной валидности заключается в теоретическом объяснении того, что измеряет данный тест. Н-р, мы хотим с помощью теста измерить чувство страха перед экзаменами. Степень валидности этого измерения можно определить лишь в том случае, если проверить возможность подтверждения позитивных или негативных реакций, предсказываемых теоретически. В частности, 1) падает ли под влиянием временного фактора успеваемость учащегося, испытывающего чувство страха перед экзаменами, особенно сильно;2)отличается ли в подобных ситуациях реакция лиц с сильно развитым интеллектом от реакции интеллектуально менее развитых людей;3)можно ли подтвердить появление сопутствующих явлений (пот, дрожь) и т.д.

в) конвергентная (сходящаяся) и дискриминантная (разделяющая) валидность связаны с конструктной валидностью. Наиболее оптимальной ситуацией при создании нового теста является та, когда для измерения данного свойства в психологии уже имеется процедура с известной валидностью. В этом случае разработчик ищет корреляцию между баллами двух тестов.Если эта корреляция оказывается высокой, то говорят, что новый тест обладает конвергентной валидностью по отношению к старому, или тесты конвергируют друг с другом. Если он оказывается более компактным и экономичным в проведении и подсчете, то обычно применяют его. Н-р, если создается тест интеллекта, то часто результаты по нему сравнивают со шкалой Векслера или другими методиками.

От критерия конвергентности неотделима проверка теста по принципу дискриминантной валидности. Если созданный психологический конструкт адекватно отражает психическую реальность, то корреляция между конвергентными тестами будет выше, корреляции между каждым из этих тестов и измерителями любых других свойств.

Конвергентная и дискриминантная валидность проявляются и в следующем. Измеряемое психическое свойство имеет не одно, как правило, а несколько внешних поведенческих проявлений, которые естественно должны высоко коррелировать друг с другом. В связи с этим создание адекватного конструкта должно означать, что его автор в состоянии предсказать, какие именно внешние проявления данного психического свойства будут «конвергировать» друг с другом.

г) практическая валидность рассматривается в двух видах: прогностическая и совпадающая. Они характеризуют тест с точки зрения его ценности в отношении достижения определенной практической цели (прогнозирования, классификации, диагностики). Количественно эти виды валидности определяются путем вычисления коэффициента корреляции между оценками представителей стандартизации по тесту, с одной стороны, и показателями их учебной или профессиональной деятельности, принятыми в качестве внешнего критерия, с другой.

Прогностическая валидность– это степень соответствия теста задаче прогнозирования успешности, с которой испытуемый будет выполнять определенную деятельность в будущем. Н-р, необходимо составить прогноз об успеваемости учащихся в вузе. Прогноз должен быть выполнен к концу обучения в начальной школе в форме результатов тестирования. По происшествии определенного времени, накануне окончания вуза, определяется успеваемость и устанавливается взаимосвязь с прогностическими данными.

Совпадающая валидность применяется при решении задач классификации испытуемых или диагностики имеющихся у них недостатков.

Таким образом, если тест, обладающий прогностической валидностью, позволяет ответить на вопрос, «Какова вероятность того, что индивид Х со временем приобретет свойство У?», то наличие у теста совпадающей валидности позволяет получить ответ на вопрос: «Какова вероятность того, что индивид Х обладает свойством У?».

Различные виды и типы валидности являются по отношению друг к другу не альтернативными, а взаимодополняющими. Следовательно, что эффективная тестовая методика может быть создана только на основе системного подхода. Вначале необходимо обеспечить валидность содержательно-теоретического типа (имманентную – для тестов с простым содержанием и оценочную или конструктивную – для тестов с более сложным содержанием). Затем, основываясь на данных о психологическом содержании теста, выяснить его соответствие тем или иным практическим целям(прогностическим или диагностическим). Наконец, на 3-ем этапе принимаются меры для придания тесту внешней валидности.