|
Если вычисленное значение хи-квадрат выше табличного с одной степенью свободы, то нулевая гипотеза (о нулевой устойчивости) отвергается. Удобство в использовании фи-коэффициента состоит в том, что он одновременно оценивает степень оптимальности данного пункта по силе (трудности): фи-коэффициент оказывается тем меньше, чем сильнее частота ответов «да» отличается от частоты ответа «нет».
Кроме того, сама четырех клеточная таблица позволяет нам про следить возможную несимметричность в устойчивости ответов «да» и «нет» (это важнее. для задач, чем для вопросов: например, может оказаться, что все испытуемые, уже решившие однажды данную задачу, решают ее при повторном тестировании — это наводит на мысль о том, что при втором тестировании происходит сбережение опыта, приобретенного при первом тестировании). Выявленные в результате такого анализа неустойчивые и неинформативные (слишком сильные или слишком слабые) пункты должны быть исключены из теста. Пункты следует считать недостаточно устойчивыми, если на репрезентативной выборке величин а 1/^1—9 превышает 0,71. При этом q><0,5.
Для того чтобы повысить одномоментную (синхронную) надежность теста, следует из исходной пилотажной батареи пунктов отбросить те, которые плохо согласованы с остальными3. В отсутствие компьютера согласованность для пунктов также очень просто определяется с помощью четырех клеточной корреляции. В этом случае в первом столбце таблички суммируются ответы испытуемых из «высокой» группы (по величине суммарного балла), во втором столбце — из «низкой».
Высокая «Низкая
Да Нет „ низка я\ / группа, / | А | В | |
С | D | ||
При нормальном распределении час- цыеаюа» тот суммарных баллов «высокая» и \!группа «низкая» группы отсекаются справа \ / и слева 27%-ными маргинальными |у квантилями (рис. 8). ||jv Для оценки согласованности с сум-^^. марным баллом применяется полная гЦ^ч (3.2.12) 4 или упрощенная формула | |||
г?'/, 73% х фи-коэффициента: 2а — pi— 1 | (3.2.14)8 |
где Pi — количество ответов «верно» |
i г<
I!
той» я «низкой» группы на графике распределения тестовых баллов
(«да») на i-тый пункт теста; N*'— сумма всех элементов таблички; ЛГ*=п-0,54, где п — численность всей выборки;
t'li
У:
8 В ряде пособий показатель согласованности для пунктов называется дискрими-нативностью пунктов (Гайда В. К.. Захаров В. П., 1982).
«'Полная формула отличается от (3.2.12) наличием в числителе вычитаемого-
(a+b+c+d)/2 — поправки с учетом вклада, который i-тый пункт вносит в суммар-
вый балл X...--,... „ n, i
5 Если 2а — Pi<Q, то числитель в формуле (3.2.14) выглядит так: 2о —F(+l.
Pi=a+b. При включении в эстремальную группу 1/3 выборки N*t* =0,66-л.
В некоторых случаях подобный анализ позволяет уточнить ключ для пункта: если пункт получает значимый положительный фи-коэф-
, фициент, то ключ определяется величиной «+ \ж, если пункт получав» значимый отрицательный фи-коэффициент, то величиной «—1». Если пункт получает незначимый фи-коэффициент, то его целесообразно исключить из батареи.
При ручных вычислениях фи-коэффициента удобно вначале с помощью формул (3.2.13) и (3.2.14) определить граничное значение значимого (по модулю) фи-коэффициента. Например, при выборке в 100 человек и уровне значимости р<0,01 пороговое значение вычисля-
ется так:,
0,27.
(3.2.I5J-
При постоянном использовании компьютера при подсчете суммарных баллов — ключ для каждого пункта С/ целесообразно' определить в виде самого фи-коэффициента (или другого коэффициента корреляции), определенного при коррелировании ответов на пункт с суммарным баллом. Тогда тестовый балл подсчитывается по формуле
(3.2.16)
где xi — суммарный балл t'-того испытуемого;
rh — ответ «верно» (+1) или «неверно» (—1) i-того испытуемого на /-тый пункт;
С/ -г- ключ для /-того пункта: С/= +1 для прямого, С/ == — 1 для
обратного. •
Более чувствительный коэффициент, который также применяется для дихотомических пунктов,— это точечный бисериальный коэффициент корреляции, учитывающий амплитуду отклонения индивидуальных суммарных баллов от среднего балла:
— У.** —#*
(3.2.17)
где 2** — сумма финальных баллов тех индивидов, которые дали утвердительный ответ на i-тый пункт теста (решили t'-тую задачку);
Sx — стандартное отклонение для суммарных баллов всех индивидов.из_в_ыборки;
i — стандартное отклонение по /-тому пункту;
х — средний балл по всем пунктам.
А. Анастази относит критерий внутренней согласованности теста к валидности (Анастази А., 1982, кн. 1, с> 143), однако если и можно в данном случае говорить о валидности, то только в смысле особой внутренней валидности теста. Как правило, слишком высокая согласованность снижает внешнюю валидноеть теста по критерию (см. § 3.3J. Если проверяется согласованность пунктов, составленных одним автором (одним коллективом по стандартной инструкции), то выявление достаточного набора согласованных пунктов свидетельствует о внут-
ренней валидности (согласованности) разработанного диагностического понятия (конструкта).
Иррелебантные факторы |
В компьютерных данных факторного анализа аналогом корреляции пункта с суммарным баллом является нагрузка пункта на ведущий фактор («факторная валидность» в терминах А. Анастази). Если прибегать к геометрическому изображению нагрузки как, проекции вектора-пункта, на ось-фактор, то структура пунктов хорошо согласованного теста предстанет в виде пучка векторов, плотно прилегающих к фактору и вытянувшихся вдоль его оси (рис. 9).
Прямые пункты |
РелеВант? —— ныи |
Рис. 9. Векторная графическая модель соотношения «прямых»,. и «обратных» эмпирических индикаторов (пунктов) с релевантным (измеряемым) фактором и иррелевантнымн ' («шумовыми»).факторами |
Последовательность действий при проверке надежности. 1. Узнать, существуют ли данные о надежности теста, предполагаемого к использованию, на какой популяции и в какой диагностической ситуации проводилась проверка. Если проверки не было или признаки новой популяции и ситуации явно специфичны, провести заново проверку надежности с учетом указанных ниже возможностей.
2. Если возможности обследования испытуемых, смысл теста и возможности обработки (наличие ЭВМ) позволяют, то произвести по-втор4ное тестирование на всей выборке стандартизации и подсчитать все коэффициенты, приведенные в § 3.2, как для целого теста, так и для отдельных пунктов. Анализ полученных -коэффициентов позволит понять, насколько пренебрежимо ошибка измерения, дает ли данный тест интервальную шкалу (высокий г) или только диагностичен для крайних групп (высокий <р), насколько устойчиво измеряемое свойство во времени- (возможен ли статистический прогноз — проекция тестового бала на будущее), в каких своих частях (пунктах) тест менее надежен (анализ этих пунктов позволяет психологически осмыслить содержательный механизм взаимодействия пунктов с испытуемыми). 3. Если возможности ограничены, произвести повторное тестирование только на части выборки (не менее 30 испытуемых), подсчитать (вручную) ранговую или четырех клеточную корреляцию для оценки внутренней согласованности (методом расщепления) и стабильности целого теста.
Дата добавления: 2015-10-24; просмотров: 30 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
ИЗ ИСТОРИИ КОНТЕНТ-АНАЛИЗА КАК ПСИХОДИАГНОСТИЧЕСКОЙ | | | ПРОГНОЗ И РАСПОЗНАВАНИЕ ОБРАЗОВ |