Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Валидность консенсусная



Читайте также:
  1. Валидность
  2. Валидность ≤ Надежность, что означает, что валидность не может превышать надежность теста.
  3. Валидность < надежность
  4. Валидность и ее виды.
  5. ВАЛИДНОСТЬ И СТАНДАРТИЗАЦИЯ
  6. Валидность как критерий оценки качества теста. Виды непосредственной валидности.
  7. Валидность как критерий оценки качества теста. Виды опосредственной валидности.

(consensual validity) — тип валидности, основывающейся на установлении связи (корреляции) тестовых данных с данны­ми, полученными от внешних экспертов, хорошо знакомых с теми лицами, которые были подвергнуты тестированию. Поня­тие и процедура В. к. введены Р. Мак-Краэ в 1982 г. с целью обеспечения вали-дизации опросников личностных, кото­рая нередко затруднена (а иногда и невоз­можна) в связи с отсутствием необходи­мых для установления валидности крите­риев.

ВАЛИДНОСТЬ КОНСТРУКТНАЯ

один из основных типов валидности, от­ражающий степень репрезентации иссле­дуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать практический или вер­бальный интеллект, эмоциональная неус­тойчивость, интроверсия, понимание ре­чи, переключаемость внимания и т. д. Иначе говоря, В. к. определяет область те­оретической структуры психологических явлений, измеряемых тестом.

Поскольку проявления таких конст­руктов, как, напр., интеллект в деятельно­сти человека многообразны и неоднознач­ны с т. з. их выделения, процедура уста­новления В. к. по сравнению с валиднос­тью критериальной или валидностью содержательной сложна.

При объяснении связи полученных тестовых результатов с теоретическим конструктом необходимо постепенное на­копление разнообразной информации о динамике развития измеряемого свой­ства, а также о его взаимодействии с дру­гими психическими явлениями.

Среди конкретных методов характери­стики В. к. в первую очередь необходимо назвать сопоставление исследуемого на предмет В. к. теста с другими методиками, конструктное содержание которых извес-

тно. Наличие корреляции между новым и аналогичным по конструкту тестом ука­зывает на то, что разрабатываемый тест «измеряет» примерно ту же сферу поведе­ния, способность, личностное качество, что и эталонная методика. Такая процеду­ра валидизации напоминает определение критериальной валидности в том смысле, что эталонный тест, валидность которого определена, выступает в качестве незави­симого критерия.

Следует, однако, заметить, что, в отли­чие от критериальной валидизации, при анализе В. к. не требуется высокой степе­ни связи результатовдвух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию и результатам и разрабатываемая методика не обладает преимуществами краткости или легкости применения, это означает лишь дублирование теста, оправданное только с т. з. создания параллельной формы теста. Смысл процедуры В. к. со­стоит в установлении одновременно как сходства, так и различия психологичес­ких феноменов, измеряемых новым тес­том по сравнению с известным.

При анализе В. к. методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с широки^ кругом других тестов, направ­ленных на конструкты, находящиеся в те­оретически известной или предполагае­мой связи с исследуемыми. При этом В. к. характеризуется не только связями про­веряемого теста с близкородственными показателями, но и с теми, где, исходя из гипотезы, значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная (проверка степени близости прямой или обратной связи) и дискриминантная (установление отсут­ствия связи) валидизации. Подтвержде­ние совокупности теоретически ожидае­мых связей составляет важный круг све­дений В. к. В англоязычной психодиагно-

стике такое операциональное определе­ние В. к. обозначается как «предполагае­мая валидность» (assumed validity).

Прямое отношение к характеристике В. к. имеет факторный анализ, позволя­ющий строго статистически проанализи­ровать структуру связей показателей ис­следуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы сопоставляе­мых тестов факторы, степень их представ-ленности в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важ­ность такой процедуры является основа­нием для выделения ее в особый вид В. к. — факторную валидность.

Важным аспектом В. к. является внутренняя согласованность, отражаю­щая то, насколько определенные пункты (задания, вопросы), составляющие мате­риал теста, подчинены основному направ­лению теста как целого, ориентированы на изучение одних и тех же конструктов. Анализ внутренней согласованности осу­ществляется путем коррелирования отве­тов на каждое задание с общим результа­том теста. Следует отметить, что крите­рий внутренней согласованности указы­вает лишь на меру связи всего содержа­ния теста с измеряемым конструктом, да­вая лишь косвенную информацию о при­роде измеряемого свойства.

При определении В. к. важное место принадлежит изучению динамики измеря­емого конструкта. При этом мы можем опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из та­ких подходов является применение крите­рия возрастной дифференциации (см. Ва­лидность по возрастной дифференциа­ции), что предусматривает согласование результатов теста с ожидаемыми измене­ниями, которые претерпевает изучаемое психическое свойство в возрастной дина-

мике при переходе на новый этап разви­тия. Этот метод В. к. особенно важен для валидизации тестов интеллекта, дос­тижений в обучении.

В комплекс сведений о В. к. методики входят также данные, относящиеся к сфе­ре критериальной и содержательной ва-лидности. Так, критерии, используемые при валидизации, несут информацию, по­зволяющую раскрыть область поведения, качества, представленные в тесте в виде конструкта. Для характеристики В. к. не­обходимы связь с практическими форма­ми деятельности, достоверность прогноза реального поведения. Однако В. к. являет­ся качественно более высоким и комплек­сным уровнем описания теста, характери­зуя область измеряемого поведения в ши­роких психологических понятиях. Благо­даря данным В. к. мы можем с психологи­ческих позиций закономерно объяснить результаты теста и их дисперсию, обосно­вать диагноз, введя измеряемое свойство в систему психологических категорий, прогнозировать поведение в более широ­ких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность.

В качестве примера, иллюстрирующе­го необходимость глубокого анализа тео­ретического конструкта, лежащего в ос­нове конкретной методики, для правиль­ного применения теста и интерпретации его результатов, можно привести сопос­тавление двух популярных опросников личностных «Проявления тревожнос­ти» шкалы (MAS) и варианта Айзенка личностных опросников EPI. Корреля­ционные исследования показывают, что шкала «тревожности» MAS положитель­но коррелирует со шкалой «нейротизма» и отрицательно — со шкалой «экстравер­сии* EPL С т. з. концепции Айзенка, эти данные можно рассматривать как свиде­тельство низкой валидности шкалы MAS: «тревожность» коррелирует не только с

релевантным фактором «нейротизм», но и с иррелевантным фактором «интровер-сия». С этой т. з. MAS оказывается про­сто нечувствительным к особой разновид­ности «нейротизма» — нейротизму (тре­вожности) экстравертов: из перечня пун­ктов MAS исключены высказывания, в ко­торых могла бы проявиться тревожность экстраверта. Однако с теоретических по­зиций К. Спенса и Дж. Тейлор, эта ситуа­ция вполне закономерна, желательна и никак не является артефактом — след­ствием дефекта данного диагностическо­го средства. Согласно К. Спенсу,-пытав­шемуся переносить на человеческое пове­дение теорию научения Халла, MAS изме­ряет общий уровень драйва — неспециа­лизированного побуждения, которое как раз достигает максимума при сочетании нейротизма (специфическая активация, по Айзенку) и интроверсии (неспецифи­ческая активация) (Практикум по психо­диагностике, 1984). Таким образом, на­звания тестов не всегда однозначно вы­ражают понятия об измеряемом свойст­ве. В данном примере особенно подчерки­вается роль психологической теории, ле­жащей в основе методики для раскрытия содержания показателей, получаемых с ее помощью.

ВАЛИДНОСТЬ КРИТЕРИАЛЬ-

НАЯ — комплекс характеристик, вклю­чающий валидность текущую и прогно­стическую методики и отражающий соответствие диагноза и прогноза опреде­ленному кругу критериев измеряемого явления. В качестве валидизации крите­рия выступают независимые от результа­тов теста и непосредственные меры ис­следуемого качества, такие как уровень достижений в какой-либо деятельности, степень развития способности, выражен­ность определенного свойства личности и т. д. Так, В. к. опросника личностного для измерения социальной интроверсии

может быть определена на основании со­поставления результатов теста с экспер­тными оценками хорошо знающих обсле­дуемого лиц, с результатами наблюдения за проявлением этой особенности в его поведении, с объективными сведениями о круге общения. При валидизации тестов достижений результат измерений срав­нивается с мнением педагогов о знаниях обследуемого в определенной области, с академическими оценками, контрольны­ми проверками и т. д. В случае валидиза­ции профориентационных тестов и мето­дик тестовые оценки сравниваются как с экспертными оценками коллег и руково­дителей, так и с объективными показате­лями достижений в профессиональной сфере.

В. к. включает как комплекс связей с текущим состоянием изучаемого явле­ния, так и вероятность и обоснованность прогноза о его состоянии в будущем. Здесь в рамках В. к. различаются валидно­сти текущая (диагностическая, конкурен­тная) и прогностическая. В случае харак­теристики текущей В. к. изучение корре­ляции результатов теста с независимыми критериями проводится параллельно с из­мерением. Таким образом, показатели те­кущей В. к. указывают на степень репре­зентации характеристик-изучаемого пси­хического явления в результате теста. Предсказательная В. к. может отражать как соответствие прогноза, сделанного на основании данного теста, с реальным со­стоянием измеряемого качества спустя некоторое время, так и временной интер­вал, в котором результат теста является валидным.

Валидизация по какому-либо крите­рию эффективно осуществляется мето­дом контрастных групп. При этом, как правило, используют сложный критерий, в котором отражено комплексное влияние различных факторов. Напр., при характе­ристике В. к. теста интеллекта показате-

ли умственно отсталых детей могут быть сопоставлены с показателями нормаль­ных школьников того же возраста. Мно­жество факторов, обусловивших помеще­ние ребенка в специальное учреждение для детей с глубокой умственной отстало­стью, составят критерий валидизации. Аналогично В. к. личностного опросника, предназначенного для выявления «уровня невротизации», определяется на основе сравнения его результатов у пациентов, страдающих неврозами, и практически здоровых людей. Такой критерий в силу его обобщенности и интегративности при­ближает В. к. к области валидности кон-структной.

Более эффективным с т. з. практи­ческой направленности теста (т. е. его адекватности как средства диагноза и про­гноза реальной деятельности) является соотнесение результатов с критериальны­ми мерами определенных существенных элементов изучаемой деятельности или способности. Так, напр., тест для опреде­ления профессиональных способностей конторского служащего может включать анализ грамотности письма, счетных спо­собностей, комбинаторного мышления, навыков делового общения и т. д. Валид­ность такого сложного по составу теста, включающего разные группы заданий, мо­жет определяться, как показано выше, критерием «успешности трудовой дея­тельности», однако более точным и пра­вильным будет соотнесение с ее элемен­тами, перечисленными выше, по отдель­ности. Информация о текущей или про­гностической валидности по такому эле­ментному критерию носит название син­тетической валидности. Процесс валиди­зации в данном случае складывается из детального анализа тестируемой деятель­ности для выявления ее существенных со­ставных элементов, определения удельно­го веса элементов в составе сложной дея­тельности; определения связи с критери-

ями по каждому из выделенных элемен­тов деятельности; определения валиднос-ти теста путем «синтеза весов* отдельных элементов в реальной деятельности и в тесте (см. Валидности коэффициенты). Валидизация теста может осуществ­ляться на основе критерия, отражающего событие или состояние качества в про­шлом (ретроспективная валидизация).. Сведения такого рода, как правило, явля­ются дополнительными и применяются в случаях невозможности валидизировать тест по текущему или перспективному критерию. Одним из видов В. к. является валидность инкрементная.

ВАЛИДНОСТЬ ОЧЕВИДНАЯ — пред ставление о тесте, сфере его применения, результативности и прогностической цен­ности, которое возникает у испытуемого или другого лица, не располагающего спе­циальными сведениями о характере ис­пользования и целях методики. В. о. не является компонентом объективно уста­навливаемой валидности. Вместе с тем высокая В. о. в большинстве случаев яв­ляется весьма желательной. Она выступа­ет в качестве фактора, побуждающего ис­пытуемых к обследованию, способствует более серьезному и ответственному отно­шению к работе по выполнению заданий теста и к заключениям, формулируемым психологом.

Достаточный уровень В. о. особенно значим для методик обследования взрос­лых. Если содержание тестовых заданий будет представляться несерьезным, чрез­мерно легким, не соответствующим сути изучаемой деятельности, это может при­вести к ироническому, негативному или враждебному отношению испытуемых к ситуации обследования. Напротив, ги­пертрофированное отношение к возмож­ностям методики, не вполне адекватное представление о ее направленности и прогностической значимости может вы-

звать избыточную мотивацию, неже­лательную эмоциональную напряжен­ность при обследовании, выраженное ус­тановочное поведение. Очевидно, что в приведенных случаях за счет неадекват­ной В. о. реальная валидность теста сни­зится.

Представления испытуемых и пользо­вателей психодиагностической информа­цией о В. о. в немалой степени определя­ются названием методики, поскольку эта часть сведений о тесте наиболее доступ­на неспециалистам. Для предупреждения неадекватных мнений о методике следует избегать помещения на бланках, опрос­ных листах, тестовых тетрадях туманных, необоснованно общих названий, которые могут быть неправильно истолкованы (напр.: «Тест личности», «Тест умствен­ных способностей», «Комплексная бата­рея оценки достижений» и т. д.). Адекват­ность В. о. повышается путем введения в инструкцию краткой характеристики це­лей исследования.

В. о. существенно улучшает примене­ние понятных формулировок и терминов, а также заданий, по содержанию являю­щихся наиболее естественными с учетом возрастной, половой, профессиональной специфики испытуемых. Неадекватно за­вышенная В. о. способствует более выра­женному проявлению эффекта контами­нации критерия.

В. о. иногда носит название внешней (face validity), или «доверительной» (faith validity), валидности.


Дата добавления: 2015-07-10; просмотров: 106 | Нарушение авторских прав






mybiblioteka.su - 2015-2024 год. (0.008 сек.)