Читайте также:
|
|
Номер задания | Объединяемые общим понятием объекты | Оценка | |
2 балла | 1 балл | 0 баллов | |
61 Яблоко — земляника | Плоды | Имеют кожуру, стебель | Круглые, красные |
67 Семя — яйцо | Зародыш | Пищевые продукты | Продукты сельского хозяйства |
75 Благословение — проклятие | Санкции, пожелания | Осуждение, заклинание | Угрозы, похвалы |
Как видно из табл. 18, критерии разделения на «сильные» и «слабые» понятия условны и недостаточно конкретизированы. Наглядно проступает необходимость тщательной проработки системы оценивания для задач такого типа.
При подсчете количества правильных решений или совпадений с ключом повсеместно используются шаблоны. Технические ошибки в «ключе», возникающие при дублировании и размножении методик, являются одной из распространенных причин появления ошибочных результатов. Точность подсчета О. п. в значительной мере обеспечивается рациональным оформлением и организацией бланка обследования.
ОЦЕНКИ ПРОФИЛЬНЫЕ — способ представления количественных результатов психодиагностической методики. При таком способе оценки по отдельным группам заданий, субтестам тестовой батареи с помощью специальных приемов приводятся к соизмеримым единицам (единой шкале оценок) (см. Стандартизация, Оценки шкальные) и отображаются на общем графике. Соизмеримость оценок тестов, результаты которых выносятся на «профиль», достигается с помощью выравнивающих коэффициентов (см. Шмишека опросник), унификации оценок первичных, преобразования стандартизированных оценок в шкалу с едиными значениями М и s.
Наряду с наглядностью представления количественных данных с помощью «профиля» обеспечивается также возможность качественного анализа и интерпретации результатов тестовой батареи, изучения структуры суммарного тестового результата (см. IQ-показатель стандартный). Впервые О. п. были применены в Россолимо психологических профилях. Объединение количественных результатов различных субтестов в этой методике основывалось на том, что оценка каждого теста соответствовала числу удач или неудач при его десятикратном повторении.
О. п. наиболее распространены в тестах интеллекта, состоящих из комплекса субтестов (см. Амтхауэра интеллекта структуры тест (см. рис. 4), Векслера интеллекта измерения шкалы (рис. 14) и др.). Особое значение О. п. имеют и в многошкальных опросниках личностных. Представление результатов в виде О. п. часто объединяется с процедурой кодирования оценок тестовых.
Примеры О. п. приведены на рис. 49, рис. 41, 42 к статье Миннесотский многоаспектный личностный опросник, рис. 40 к статье Мейли интеллекта аналитический тест.
Рис. 49. Образец «профиля» оценок Мейли интеллекта аналитического теста
ОЦЕНКИ ШКАЛЬНЫЕ — способ оценки результата теста путем установления его места на специальной шкале. Шкала содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации. Так, индивидуальные результаты выполнения заданий (оценки первичные испытуемых) сравниваются с данными в сопоставимой нормативной группе (напр., результат, достигнутый учеником, сравнивается с показателями детей того же возраста или года обучения; результат исследования общих способностей взрослого сопоставляется со статистически обработанными показателями репрезентативной выборки лиц в заданных возрастных пределах).
О. ш. в этом смысле имеют четко определенное количественное содержание и могут быть использованы при статистическом анализе. Одной из распространенных в психологической диагностике форм оценки результата теста путем соотнесения с групповыми данными является расчет процентилей. Процентиль -процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций (см. Корреляция ранговая) при числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату; 50-й процентиль (P50) соответствует медиане (см. Меры центральной тенденции) распределения результатов, Р>50 и Р<50 соответственно представляют ранги результатов выше и ниже среднего уровня результата.
Процентили не следует смешивать с обычными процентными показателями. Последние представляют собой долю правильных решений из общего количества заданий теста в индивидуальном результате (см. Оценки первичные). Ранги Р1 и Р100 получают соответственно самый низкий и самый высокий результаты из наблюдавшихся в выборке, однако этим рангам могут соответствовать и далеко не нулевой (ни одного правильного решения) или абсолютный (все решения правильны) показатели (например, при общем количестве 120 заданий минимальный результат, соответствующий первому рангу, может составить 6 правильных решений, в то время как максимальный результат, соответствующий рангу Р100, будет составлять 95 правильно решенных заданий). Такая ситуация наблюдается, напр., при оценке тестов скорости.
Основной недостаток процентильных шкал состоит в неравномерности единиц измерения. При нормальном распределении отдельные переменные тесно группируются в центре распределения и по мере удаления к краям рассеиваются. Поэтому равным частотам случаев вблизи центра соответствуют более короткие интервалы по оси абсцисс, расположенные по краям распределения оценок. Процентили показывают относительное положение каждого испытуемого в нормальной выборке, но не величину различий между результатами. Это создает некоторые неудобства в интерпретации индивидуальных результатов. Так, разница в первичных показателях, соответствующая интервалу Р70 - P80, может составить 10 баллов, а различие в количестве правильных решений в интервале рангов P50 – P60 — лишь 1-3 балла.
Вместе с тем процентильные оценки обладают и рядом достоинств. Они легко доступны пониманию пользователей психодиагностической информацией, универсальны по отношению к различным типам методик и легко рассчитываются.
Процентильные оценки не относятся к типичным шкальным показателям. Более широкое распространение в психодиагностике получили стандартные показатели, рассчитываемые на основе линейного и нелинейного преобразования первичных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится z-преобразование оценок (см. Стандартизация, Нормальное распределение). Чтобы определить z-стандартный показатель, определяют разность между индивидуальным первичным результатом и средним значением для нормальной группы, а затем делят эту разность на σ нормативной выборки. Полученная таким образом шкала z (рис. 50) имеет среднюю точку М = 0, отрицательные значения обозначают результаты ниже среднего и убывают по мере удаления от нулевой точки; положительные значения обозначают соответственно результаты выше среднего. Единица измерения (масштаб) в шкале z равна 1σ стандартного (единичного) нормального распределения.
Рис. 50. Нормальная кривая, процентные и стандартные оценки
Для преобразования полученного при стандартизации распределения первичных нормативных результатов в стандартную z-шкалу необходимо исследовать вопрос о характере эмпирического распределения и степени его согласованности с нормальным (см. Оценка типа распределения).
Поскольку для большинства случаев значения показателей в распределении умещаются в пределах , единицы измерения простой z-шкалы слишком велики. Для удобства оценивания применяется еще одно преобразование типа . Примером такой шкалы могут а быть оценки тестовой батареи SAT (СЕЕВ) методики для оценки способности к обучению (см. Тесты достижений). Эта z-шкала пересчитана таким образом, что средней точке соответствует значение 500, а = 100 (рис. 50). Другим аналогичным примером является шкала Векслера для отдельных субтестов (см. Векслера интеллекта измерения шкала, где М= 10, = 3.
Наряду с определением места индивидуального результата в стандартном распределении групповых данных введение О. ш. направлено и на достижение другой важнейшей цели — обеспечение сопоставимости количественных результатов различных тестов, выраженных в стандартных шкалах, возможности их совместных интерпретаций, сведение оценок к единой системе.
В случае, если оба распределения оценок в сравниваемых методиках близки к нормальному, вопрос о сопоставимости оценок решается довольно просто (в любом нормальном распределении интервалам М ± n σ соответствует одинаковая частота случаев). Для обеспечения сопоставимости результатов, принадлежащих к распределениям другой формы, применяются нелинейные преобразования, позволяющие придать распределению форму заданной теоретической кривой. В качестве такой кривой обычно используется нормальное распределение. Как и в простом 2-преобразовании, нормализованным стандартным показателям можно придать любую желаемую форму. К примеру, умножив такой нормализованный стандартный показатель на 10 и прибавив константу 50, получаем Т-показатель (см. Стандартизация, Миннесотский многоаспектный личностный опросник).
Примером нелинейно преобразованной в стандартную шкалу является и шкала станайнов (англ, standart nine — стандартная девятка), где оценки принимают значения от 1 до 9, М = 5, ≈2.
Шкала станайнов получает все большее распространение, сочетая в себе достоинства стандартных шкальных показателей и простоту процентилей. Первичные показатели легко преобразуются в станайны. Для этого испытуемых ранжируют по возрастанию результатов и из них образуют группы с числом лиц, пропорциональным определенным частотам оценок в нормальном распределении тестовых результатов (табл. 19). При трансформации оценок в шкалу стэнов (от англ, standart ten — стандартная десятка) проводится аналогичная процедура с той лишь разницей, что в основании этой шкалы лежат десять стандартных интервалов.
Таблица 19
Дата добавления: 2015-07-10; просмотров: 115 | Нарушение авторских прав