Надежность теста — это характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов /Бурлачук Л. Ф. и

Надежность теста — это характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов /Бурлачук Л. Ф. и др., 1989/.

Результат психологического исследования обычно подвержен влиянию большого количества неучитываемых факторов (например, эмоциональное состояние и утомление, если они не входят в круг исследуемых характеристик, освещенность, температура и другие особенности помещения, в котором проводится тестирование, уровень мотивированности испытуемых и т. д.). Поэтому любая эмпирически полученная оценка по тесту y_i представляется как сумма истинной оценки у _¥и ошибки измерения ε: y_i=у _¥ + е. В целях анализа надежности вводится понятие «параллельных тестов», которыми называются тесты, в одинаковой мере измеряющие данное свойство посредством одних и тех же действий и операций /Кулагин Б. В., 1984/. Это понятие является обобщенным, так как параллельными тестами могут быть и параллельные формы и повторные обследования испытуемых одной и той же методикой. Если принять допущения, что измеряемые у индивидуумов свойства мало изменяются во времени, а ошибки полностью случайны и несистематичны, то параллельные тесты дают результаты с одинаковыми средними значениями, среднеквадратическими отклонениями, интеркорреляциями и корреляциями с другими переменными.

Коэффициент надежности R_yy определяется как корреляция параллельных тестов, которая, в свою очередь, равна отношению

где σ²_у_¥— дисперсия истинной оценки, а σ²_у — дисперсия эмпирической оценки.

Корреляция параллельных тестов с какой-либо другой переменной z определяется соотношением

где R_y _¥z— корреляция истинных оценок i>у_¥с переменной z. Эта формула показывает, что корреляция теста с любой внешней переменной ограничивается коэффициентом надежности. Например, если корреляция истинной оценки у _¥ с переменной z (R_y _¥z ) равна 1,0, а коэффициент надежности (R_yy) равен 0,70, то эмпирическая корреляция (R_yz) составит 0,84.

Коэффициент надежности связан со стандартной ошибкой измерения (σ_ε— среднеквадратическое отклонение ошибок измерения ε)

Отсюда следует, что при увеличении коэффициента надежности R_yy уменьшается ошибка σ_ε.

Корреляция эмпирических и истинных оценок R_yy _¥называется индексом надежности и определяется соотношением

Существует три основных подхода к оценке надежности тестов, которые различаются факторами, принимаемыми за ошибки измерения.

Тест-ретест надежность. Коэффициент надежности (R_yy) измеряется с помощью повторного обследования одних и тех же испытуемых через определенное время и равен коэффициенту корреляции результатов двух тестирований. Ошибки измерения в данном случае обусловлены различиями в состоянии испытуемых, организации и условиях повторных обследований, запоминанием ответов, приобретением навыков работы с тестом и др. Тест-ретест надежность называют также надежность — устойчивость.

Надежность параллельных форм теста. Коэффициент надежности равен корреляции параллельных форм теста. Ошибки измерения в данном случае, кроме вышеуказанных факторов, связаны с различиями в характере действий и операций, присущих параллельным формам теста. Высокое значение коэффициента корреляции, помимо высокой надежности результатов сравниваемых тестов, указывает на эквивалентность содержания этих тестов. Поэтому коэффициент надежности для параллельных форм теста носит еще одно название — эквивалентная надежность.

Надежность как гомогенность тестов. В данном случае надежность оценивается путем вычисления интеркорреляций частей или элементов методики, рассматриваемых как отдельные параллельные тесты. Такой подход справедлив для оценки тестов, при построении которых использовалась диагностическая модель, основанная на критерии автоинформативности системы исходных признаков (на принципе внутренней согласованности тестовых заданий). Наиболее распространена процедура расщепления теста на две части: в одну входят, например, результаты четных заданий, а в другую — нечетных. Для определения надежности целого теста применяют формулу Спирмена — Брауна:

где R — корреляция между половинами теста.

С учетом того, что тест, построенный по принципу внутренней согласованности заданий, можно расщеплять на части разными способами, в психометрике для оценки надежности не редко используется коэффициент Кронбаха

где а — обозначение коэффициента Кронбаха; k — число заданий теста;σ² _i — дисперсия i-ro пункта теста;σ²_у —дисперсия целого теста.

Если ответы на каждый пункт теста являются дихотомическими переменными, то применяется аналогичная коэффициенту Кронбаха формула Кьюдера — Ричардсона

где KR₂₀ — традиционное обозначение данного коэффициента надежности; p_i — доля 1-го варианта ответа на i-й вопрос; q_i = (1 — p_i) — доля второго варианта ответа на i-и вопрос.

Известны другие коэффициенты надежности для гомогенных тестов. Большинство критериев, положенных в основу этих коэффициентов, опираются на тот факт, что матрица интеркорреляций заданий надежного теста имеет ранг, близкий к единице. Например, применяется коэффициент, получивший название тета-надежности теста /Общая психодиагностика, 1987/:

где k — количество пунктов теста. l₁ — наибольшее собственное число, соответствующее 1-й главной компоненте матрицы интеркорреляций пунктов теста.

Приведенные выше формулы могут использоваться только тогда, когда каждый испытуемый работает со всеми элементами теста. Это относится к методикам, которые не имеют ограничений во времени. Независимо от выполнения данного условия часто производится оценка надежности отдельных пунктов психодиагностического теста.Надежность отдельных пунктов теста. Ретестовая надежность теста в целом зависит от устойчивости ответов испытуемых на отдельные пункты теста. Для проверки этой устойчивости вычисляется корреляция ответов испытуемых на проверяемый пункт с ответами при повторном тестировании. Для дихотомических пунктов обычно используется коэффициент φ и пункт считается недостаточно устойчивым, если φ< 0,5.Также нередко производится проверка так называемой дискриминативности заданий теста /Бурлачук Л. Ф. и др., 1989/, под которой понимается способность отдельных пунктов дифференцировать обследуемых относительно «максимального» или «минимального» результата теста в целом. Процедура проверки надежности пунктов направлена на повышение внутренней согласованности теста и соответствует описанному ранее методу контрастных групп. В качестве меры надежности пункта может использоваться коэффициент φ. Кроме того, часто применяется точечный бисериальный коэффициент корреляции r _рв,который в данном случае называют коэффициентом (индексом) дискриминации.

Дата добавления: 2015-08-29; просмотров: 148 | Нарушение авторских прав

<== предыдущая лекция	\|	следующая лекция ==>
Свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения,	\|	Билеты к экзамену по курсу:

mybiblioteka.su - 2015-2024 год. (0.013 сек.)