Читайте также: |
|
ТЕСТЫ ОБЪЕКТИВНЫЕ — видтестов, данные по которым могут быть оценены независимо от лица, проводящего тестирование и интерпретацию.
Понятие «Т. о.» введено Р. Кэттеллом (1957). Их наиболее существенной особенностью, обеспечивающей объективность обследования, является сокрытие цели от испытуемого. Не имея представления об истинной направленности методики, испытуемые лишаются возможности произвольно искажать результаты.
В качестве Т. о. могут выступать самые разнообразные методики. Р. Кэттелл и Е. Варбуртон(1967) в «Сборнике объективных тестов» описывают более 400, например:
- Тест готовности принимать быстрые решения в процессе адаптации к темноте. При проведении этого теста испытуемый находится в темной комнате. Затем включается яркий свет и ему предлагают смотреть на белый экран. Испытуемый должен назвать одну из трех последовательно предъявляемых на экране букв, как только ее увидит. Измеряемой переменной является время реакции испытуемого. Основанием для разработки теста явилось предположение о том, что испытуемые с доминированием процесса торможения должны демонстрировать более быструю световую адаптацию.
- Измерение спонтанных движений фиджетометром. Фиджетометр — вращающееся кресло с электрическими контактами, замыкающимися при движениях обследуемого. Внешне кресло неотличимо от обычных. Измеряемым показателем является количество движений за единицу времени. Основанием для разработки теста явилось предположение о том, что тревожные индивиды должны совершать больше суетливых, беспокойных движений.
Нередко в качестве Т. о. используются опросники. Напр., объективным опросником является «Тест критических оценок» (Critical Evaluations Test). Испытуемых просят указать, является ли определенная производительность труда (к примеру, если у официантки уходит 10 минут на то, чтобы принести 6 порций на столик) очень хорошей, хорошей, плохой, очень плохой. Конкретное содержание ответов не имеет отношения к оценке. В данном тесте определяется количество критических оценок.
В понимании Р. Кэттелла Т. о. имеют отношение к тестам личности. Достоинством Т. о. является известная объективность результатов, что особенно важно в области профотбора и психодиагностики клинической. Важным преимуществом Т. о. является пригодность таких методик для исследования испытуемых, принадлежащим к разным культурно-языковым общностям. Одна из основных и наиболее дискуссионных проблем, возникающих при работе с многими Т. о., — психологическое значение измеряемых переменных, которое зачастую остается неопределенным или допускает разные истолкования. Т. о. не следует смешивать с методиками, реализующими «объективный» поход к диагностике (см. Психодиагностический метод).
ТЕСТЫ ОЦЕНКИ ЮМОРА — группа тестов личности, направленных на выявление особенностей чувства юмора.
В зависимости от способа применения стимульного материала и организации обследования существуют пять типов Т. о. ю.:
— Классификация соответствия юмористического материала (афоризмов, юмористических рассказов, картин и т. д.) смыслу отражаемых тем. Группировка юмористического материала, выполняемая испытуемым, сопоставляется с образцом, полученным в нормативной группе. Например, тест чувства юмора (Sense of Humor Test) А. Робака (1939); юмористических фраз тест и др.
— Оценка «качества» юмористического материала с последующим сравнением с нормативными данными. Например, тест юмора (Sense of Humor Test) Дж. Алмака (1928); юмористический тест личности (Humor Test of Personality) P. Кэттелла и Л. Луборского (1952) и др.
— Выбор наиболее смешного из предлагаемых возможных окончаний юмористического рассказа или выбор наиболее смешной легенды к комическому рисунку (тест Люсса). В таких Т. о. ю. также возможно сравнение с результатами нормативной группы.
— Тесты типа «Истории завершение» методик, «Завершение предложения» методик.
— Свободное творчество испытуемого на заданную тему.
Под чувством юмора, на анализ которого прямо или косвенно направлены Т. о. ю., обычно понимается способность создавать вербальные или какие-либо иные произведения, которые могут развлечь, позабавить, вызвать переживание смешного, а также способность находить забавное и смешное в юмористических произведениях. Вторая группа особенностей чувства юмора наиболее легко доступна изучению. На оценку таких проявлений личности направлены первые три из приведенных выше типов Т. о. ю. Относительная ценность методик классификации юмористического материала по «значению» и по «качеству» состоит в том, что при использовании первых акцент делается на оценке чувства юмора по степени когнитивного согласия субъекта с референтной группой, а при использовании второго типа методик — по степени аффективного согласия. Результаты Т. о. ю., основанные на принципе выбора возможного окончания юмористического произведения теста, коррелируют с интеллектуальными факторами. Т. о. ю., актуализирующие деятельность по продуцированию юмористических произведений, близки по характеру к тестам креативности, интерпретация их данных связана со значительными трудностями.
Одной из важных причин интереса к Т. о. ю. и их достаточно широкого распространения в психологической диагностике является то, что исследуемые с их помощью психологические особенности тесно связаны с личностью испытуемого. В оценках юмористической продукции проявляются структура отношений личности, образцы эмоционального реагирования в тех или иных ситуациях, особенности мотивационной сферы. В качестве примеров можно привести способность субъекта посмеяться над шуткой, направленной в его адрес, возможность внутренней разрядки эмоциональной напряженности и т. д. Юмористический тест личности Р. Кэттелла и Л. Луборского является одним из наиболее известных примеров использования Т. о. ю. в качестве индикатора личностных переменных. Тест применяется в двух формах и строится на оценке шуток и карикатур. Форма А содержит 104 пары шуток, в каждой из которых испытуемый выбирает более смешную с его т. з. В форме В 130 шуток и карикатур, каждая из которых оценивается как смешная или несмешная. Таким образом, форма В позволяет контролировать установку на ответы, отмечать в качестве смешных или несмешных разное количество шуток. Форма А дает дополнительную информацию об общей тенденции восприятия юмора испытуемым. Показатели теста разработаны на основе факторного анализа, при этом выделяются 13 оценочных факторов (А. Анастази, 1982).
Анализ факторов, влияющих на результаты тестов оценки «качества шуток» (под термином «шутка» понимается любая продукция, которая может рассматриваться как юмористическая), проведенный Г. Айзенком в 40-е гг., показывает, что для тестов оценки вербальных шуток, юмористических рисунков и некоторых других существует общий фактор, ответственный за 16,5% дисперсии результатов. Этот фактор интерпретируется Г. Айзенком как фактор «чувства юмора» и в значительной мере отражает количество шуток из общего числа предлагаемых в тесте, на которые испытуемый реагирует положительно. Другими словами, если испытуемый в одном тесте обнаруживает достаточно много смешного или остроумного, то и в другом тесте на другом материале вероятна оценка большинства шуток как образцов «качественного юмора». Наряду с общим фактором «чувства юмора» в результатах Т. о. ю. выделяются и более частные. Среди таких — фактор, разграничивающий испытуемых, предпочитающих шутки с сексуальным содержанием, и тех, которые считают материал такого рода наименее интересным (5,6% дисперсии); фактор сложности шуток, противопоставляющий испытуемых, предпочитающих простые шутки, тем, кто предпочитает сложные, утонченные, «интеллектуальные» шутки (6,3% дисперсии); фактор предпочтения шуток, основанных на высмеивании особенностей личности (своей и окружающих) или, наоборот, на необычных ситуациях (безличного характера).
Различные исследования особенностей оценки юмора (Т. Андрюс, 1943; Р. Крош, 1939; Дж. Дилей и соавт., 1954) показывают, что результаты тестов более всего подвержены влиянию принадлежности испытуемых к той или иной этнокультурной группе, их культурного уровня, профессиональных особенностей и др. Против ожидания, на показатели оценки «качества юмора» практически не влияет фактор пола. Напротив, возраст испытуемого имеет весьма важное значение. Одна и та же шутка по-разному оценивается в различные периоды жизни.
Специальные исследования показывают, что коэффициент надежности тестов «оценки качества» юмора обычно невысок (около 0,55). Т. о. ю. являются перспективным направлением развития тестов личности.
В СНГ разработан юмористических фраз тест (1982).
ТЕСТЫ ПРАКТИЧЕСКИЕ — тип тестов, в которых материал задач тестовых представлен невербальными заданиями. Задачи Т. п. могут быть представлены в наглядной форме (напр., составление фигур, геометрические аналогии и т. д.) (см. Мейли интеллекта тест), распространены задания на дополнение изображения (см. Векслера интеллекта измерения шкалы). Задания теста в практической форме могут моделировать конкретные трудовые операции (см. субтесты XI и XII Общих способностей батареи тестов), требовать от испытуемого выполнения определенных действий по образцу (составление изображения из кубиков, перерисовывание); распространенными являются и задачи поиска закономерностей с наглядным решением (см. Равена прогрессивные матрицы).
Т. п. уменьшают влияние языковых и культурных различий на результат обследования (см. Культурно-свободный интеллекта тест). Выполнение задания в невербальной форме облегчает также процедуру обследования испытуемых с нарушением речи, слуха, лиц, не имеющих образования. Практические задания оказались удобными при проведении мае совых тестовых исследований (напр., известные армейские тесты «Альфа» и «Бета»).
Т. п. весьма распространены среди методик профессиональной психодиагностики (исследование моторики, достижений в овладении трудовыми операциями, оценка особенностей пространственного и комбинаторного мышления и т. д.). Многие психофизиологические диагностические методики по характеру заданий также могут быть отнесены к виду Т. п.
Примеры некоторых вариантов невербальных заданий приведены на рис. 71, 72, 73.
Рис. 72. Варианты невербальных заданий (1-18) теста достижений
Рис. 73. Невербальный тест Бернштейна
Альтернативным по отношению к Т. п. видом психодиагностических методик являются тесты вербальные, хотя их противопоставление носит несколько условный характер. Об этом, в частности, свидетельствуют и высокие показатели корреляции между невербальными и вербальными субтестами в некоторых тестах интеллекта (см. Векслера измерения интеллекта шкалы). В типичных заданиях Т. п. могут присутствовать и вербальные элементы (инструкция, ответ испытуемого).
ТЕСТЫ РЕЗУЛЬТАТИВНОСТИ (англ power tests) — тип методик, ориентированных на измерение или констатацию результата, достигнутого испытуемым при выполнении тестового задания. При этом показатель скорости работы испытуемого не принимается во внимание или имеет вспомогательное значение. В этом отношении Т. р. противоположны тестам скорости.
Следует отметить, что временное ограничение выполнения заданий может применяться и в Т. р., однако оно, как правило, служит целям стандартизации процедуры исследования или экономии времени при обследовании. К группе Т. р. относятся большинство методик исследования личности, проективные тесты, анкеты и опросники и т. д.
ТЕСТЫ СКОРОСТИ (англ, speed tests) — тип психодиагностических методик, в которых основным показателем продуктивности работы испытуемых является время выполнения (объем) задач тестовых.
Типичные Т. с. обычно включают большое количество однородных заданий (пунктов). Объем материала выбирается таким образом, чтобы за отведенное (постоянное для всех испытуемых) время ни один из обследованных не успевал справиться со всеми задачами. Тогда показателем продуктивности будет количество правильно выполненных заданий. В качестве типичного примера Т. с. можно привести корректурную пробу.
Показателем результативности выполнения Т. с. может являться и прямое измерение времени выполнения задания (напр., таблицы Шульте).
Для Т. с., состоящих из большого количества простых заданий, имеются особые процедуры определения надежности (см. Надежность частей теста), внутренней согласованности и дискриминативности заданий теста. Трудность заданий в Т. с. обычно невысока и примерно одинакова.
Большинство психометрических тестов интеллекта, общих и специальных тестов достижений являются Т. с. Ряд тестовых методик могут применяться и как Т. с., и как альтернативный вид — тесты результативности (см. Равена прогрессивные матрицы}.
Ограничение времени выполнения не является абсолютным критерием отнесения данной методики к группе Т. с. Так, при составлении рассказов в тематической апперцепции тесте продолжительность работы испытуемого регламентирована в целях сокращения времени обследования, интенсификации работы тестируемого. Вместе с тем при оценке и интерпретации результатов обследования временной показатель малосуществен.
ТЕСТЫ СПЕЦИАЛЬНЫХ СПОСОБНОСТЕЙ — группа психодиагностических методик, предназначенных для измерения уровня развития отдельных аспектов интеллекта и психомоторных функций, преимущественно обеспечивающих эффективность в конкретных, достаточно узких областях деятельности. В этом отличие Т. с. с. от тестов интеллекта, направленных на измерение общего уровня интеллектуального развития и валидизируемых по отношению к наиболее широким сферам деятельности. Валидизация Т. с. с. осуществляется по отношению к конкретным областям деятельности, и этим они близки к тестам достижений.
Разработка Т. с. с. за рубежом была связана прежде всего с необходимостью решения практических задач в области профотбора и профориентации. Так, измерение способностей к конкретным видам деятельности дополняло данные, полученные с помощью тестов интеллекта. Значительный прогресс в области измерения специальных способностей был достигнут за счет широкого применения факторного анализа, позволившего их более точно определить и классифицировать. В зарубежных психодиагностических исследованиях обычно различают следующие группы способностей: сенсорные, моторные, технические (механические) и профессионализированные (счетные, музыкальные, скорости чтения и понимания прочитанного и др.). Соответственно осуществляется и разработка Т. с. с. Наибольшее распространение за рубежом получили комплексные батареи способностей (см. Общих способностей батарея тестов).
В СССР Т. с. с. широко использовались в 20-30-е гг. для профотбора, расстановки кадров, в профориентационной работе. Затем, вплоть до 60-х гг., исследования в этом направлении были единичными. Советскими психологами достигнуты определенные успехи в изучении музыкальных, математических, психомоторных и других специальных способностей (В. А. Крутецкий, 1968; Н. С. Лейтес, I960; Б. М. Теплов, 1961; Б. В. Кулагин, 1984 и др.).
ТЕСТЫ ФАКТОРНО-АНАЛИТИЧЕСКИЕ — психодиагностические методики, конструирование которых осуществляется в соответствии с факторно-аналитическим принципом.
ТОМСКИЙ ОПРОСНИК РИГИДНОСТИ (ТОР) — опросник личностный. Направлен на диагностику психической ригидности. Предложен Г. В. Залевским в 1987 г. для выявления психической ригидности как трудности корректировки отдельных элементов или программы поведения в целом в соответствии с объективными требованиями ситуации при различной степени их осознанности и принятия.
Т. о. р. состоит из 159 заданий, сформулированных в виде вопросов и утверждений, содержание которых достаточно широко отражает те ситуации, где находит проявление психическая ригидность, т. е. в которых от человека требуется изменить программу поведения — образ жизни, стереотипы, отношения, установки, привычки, навыки, темп и ритм жизни и деятельности, средства достижения какой-либо цели, саму цель и т. д.
Возможны 4 варианта ответов («да», «скорее да», «нет» и «скорее нет»). Количественная оценка ответов по каждому пункту: «О» — психическая ригидность отсутствует, «1» —слабо выражена, «3» — сильно выражена, «4» — очень сильно выражена.
С помощью Т. о. р. диагностируется психическая ригидность по 6 шкалам, эмпирическая однородность которых подтверждена дисперсионным анализом Данных, полученных при исследовании здоровых лиц (F = 21,08; р < 0,01).
1. Шкала общей ригидности, или СКР (склонности к широкому спектру фиксированных форм поведения) т. н. «симптомокомплекс ригидности» (62 задания) — склонность к персеверациям, навязчивостям, стереотипиям, упрямству, педантизму и собственно ригидности (в узком смысле: неспособности при объективной необходимости изменить мнение, отношение, установку, мотивы и т. п.). Имеется субшкала актуальной личностной ригидности (18 пунктов), выявляющая ригидность в узком смысле.
2. Шкала сензитивной ригидности, или СР (19 заданий), отражает эмоциональную реакцию человека на ситуации, требующие от него каких-либо изменений, возможно страх перед новым, своего рода неофобию.
Основой для разработки опросника явилось предположение о том, что психическая ригидность как в норме, так и в патологии, входя в структуру личности, характеризуется следующими параметрами:
— интенсивностью (силой, глубиной) и экстенсивностью (широтой или спектром охвата структуры личности по вертикали и по горизонтали — вдоль ее подструктур);
— устойчивостью или стойкостью (реакция—состояние—черта);
— генерализованностью и доминированием (черта—симптомокомплекс—тип);
— мотивированностью (принятием—непринятием).
По мере углубления патологии, как полагает автор, должны увеличиваться показатели интенсивности и экстенсивности психической ригидности в сторону ее чрезмерной выраженности и тотальности охвата личности, а также возрастать количество случаев проявления психической ригидности как черты, генерализующейся в направлении к типу акцентуации личности, для которого чаще всего и в высокой степени характерно непринятие требований объективной ситуации.
Имеются данные о достаточно высокой валидности и надежности Т. о. р. Опросник рекомендуется использовать для дифференциальной диагностики психической ригидности у психически здоровых лиц, для уточнения прогноза реабилитации, в т. ч. психотерапии психически больных, для дифференциальной внутринозологической диагностики пограничных состояний и шизофрении в процессе психодиагностического обследования, экспресс- и скрининговых исследований, а также в семейных консультациях.
ТРЕВОЖНОСТЬ ТЕСТОВАЯ — состояние испытуемого, обусловленное действием разной степени выраженности мотива экспертизы, возникающего в психодиагностической ситуации. Т. т. более выражена у лиц с проявлением реактивной или личностной тревожности (см. Спилбергера тревоги и тревожности шкалы), у испытуемых с повышенной мотивацией на обследование, а также в случаях неадекватно высокой валидности очевидной выполняемого теста. Т. т. может явиться следствием неквалифицированного, неэтичного поведения экспериментатора, ошибочно составленной инструкции, стрессогенных факторов ситуации обследования (жесткое лимитирование времени выполнения, групповое выполнение заданий в условиях «открытости» результатов и т. п.).
Характер влияния Т. т. на результаты обследования в полной мере не выяснен. В большинстве случаев это влияние признается негативным. Так, по данным И. Годри и Ч. Спилбергера (1974), Ч. Спилбергера (1972), С. Саразона и соавт. (1960), К. Хилла и соавт. (1964, 1966) и др., существует обратно пропорциональная связь между уровнем тревожности и показателями тестов достижений и тестов интеллекта, отмечающаяся как у взрослых, так и у детей. С другой стороны, Д. Френч (1962) не обнаружил различий в результатах тестирования студентов колледжа в напряженной и спокойной ситуации. По мнению А. Анастази (1982), отношения между тревожностью и качеством выполнения теста нелинейные. Для индивидов с невысоким уровнем тревожности являются благоприятными условия, вызывающие состояние незначительной тревоги, в то время как людям, имеющим высокий уровень тревожности, лучше выполнять тест в более спокойных условиях. Т. т., таким образом, является дополнительным фактором, оказывающим воздействие на достоверность психодиагностического обследования. Поэтому необходимо принимать меры к снижению уровня напряженности в ситуации тестирования. Это особенно важно в клинической психодиагностике, где обследование имеет не только диагностическое значение, но и в определенной степени выполняет психотерапевтическую функцию. Интерпретация результатов обследования должна проводиться с учетом индивидуального уровня Т. т. конкретных испытуемых. Сведения о Т. т. могут быть получены как из данных опроса и наблюдения, так и при использовании специальных диагностических методик. Профилактика Т. т. опирается на неукоснительное следование этическим нормам психодиагностики, тщательную подготовку тестового материала, особенно инструкции, правильный выбор тактики индивидуальных и групповых обследований, условий тестирования.
ТРЕХМЕРНОЙ АППЕРЦЕПЦИИ ТЕСТ (Three Dimensional Apperception Test) — проективная методика исследования личности. Опубликована Д. Твитчел-Аллен в 1947 г.
Стимульный материал Т. а. т. состоит из 28 стандартных, объемных, не обладающих четкой формой предметов — от геометрических форм в виде шара, цилиндра и т. д. до форм, близких человеку и животным. Обследование проводится в два этапа. На первом («психодраматическом») этапе испытуемому предлагают из всех разложенных в определенном порядке предметов выбрать те, которые необходимо использовать для составления истории. При желании обследуемого к ранее отобранным предметам разрешается добавлять новые. Регистрируется стиль обращения с предметами и рассказанная история. Принципы интерпретации данных, полученных на психодраматическом этапе обследования, сходны с используемыми в тематической апперцепции тесте.
На втором этапе просят описать, что собой представляет каждый предмет, поочередно предъявляемый экспериментатором, назвать его. Известная неопределенность, пластичность предметов, которые нужно назвать, сближают этот этап с обследованием по Роршаха тесту. Автор полагает, что, в отличие от традиционных проективных методик, работа с Т. а. т. требует вовлечения тактильных, кинестетических и гаптических ощущений, которые способствуют большей неопределенности стимулов и как бы создают новые области для проекции. Валидность и надежность Т. а. т. нуждаются в дополнительном изучении. Тест может быть использован для обследования слепых (оригинальная модификация процедуры обследования — наложение зрячим на глаза повязки). Т. а. т. широкого распространения в психодиагностических исследованиях не нашел.
Сведений об использовании в СНГ не имеется.
ТРУДНОСТЬ ЗАДАНИЙ ТЕСТА -характеристика задачи (пункта) теста, отражающая статистический уровень ее решаемости в данной выборке стандартизации. Вместе с анализом дискриминативности пунктов, внутренней согласованности, характера распределения тестовых оценок анализ Т. з. т. является одной из базовых процедур разработки и проверки диагностических качеств тестовой методики.
В психологии разделяются субъективно-психологическая и статистическая (объективная) трудности. Субъективная трудность задачи связана с индивидуально-психологическим барьером, величина которого определяется как обстоятельствами (лимитом времени, доступностью инструкции и т. д.), так и уровнем формирования необходимых для решений знаний, умений и навыков, психическим состоянием испытуемого и рядом других факторов. Воздействие комплекса этих факторов на результат выполнения теста снижает надежность и достоверность данных, поэтому принимаются меры для выравнивания их воздействия с помощью направленного комплектования выборки и стандартной процедуры проведения.
Показателем Т. з. т. как статистической трудности является доля лиц выборки, решивших и не решивших задание. Напр., если только 20% испытуемых решили задачу, ее можно оценить как трудную для данной выборки, если 80% — как легкую. Т. з. т. является относительной характеристикой, поскольку зависит от особенностей выборки (возрастные, профессиональные, социокультурные различия).
Т. з. т. является в первую очередь характеристикой интеллектуальных задач, для которых правомерно применение критерия «правильного» и «неправильного» решений. Для вопросов или задач, входящих в состав личностных методик, статистическое понятие Т. з. т. неприемлемо.
Подбор заданий по показателям Т. з. т. важен для успешного применения психодиагностической методики. Так, при выборе слишком трудных заданий валидность и надежность теста резко снизятся (ухудшение статистических характеристик оценивания из-за небольшого количества правильных решений, вероятность случайной оценки, влияние неудач на работу испытуемых). Слишком простые задания приведут к однообразию результатов (большинство справляется со всем набором пунктов теста), их незначительной вариативности, затрудняющей оценивание, могут вызвать негативное отношение к тесту (см. Валидность очевидная).
Основная задача анализа Т. з. т. сводится к выбору оптимальных по сложности пунктов теста, а значит, и упорядочиванию отдельных заданий в нем. Обычно если задачу решает большинство испытуемых, ее (как легкую) помещают в начале теста, если задачу решает незначительный процент испытуемых, то ее (как трудную) помещают в конце теста. Одну-две самые легкие задачи ставят перед основными задачами теста и используют в качестве примера. Расположение заданий по возрастанию ступеней трудности, выраженных долей или процентом лиц данной выборки, решивших соответствующую задачу, позволяет примерно определить порог трудности для конкретного испытуемого, характеризующий его место в группе. Такой принцип был заложен в основу измерений первых тестов интеллекта (напр., шкалы Бине—Симона), где показателем «умственного возраста» являлось выполнение задания средней трудности для данной возрастной группы. Принцип расположения заданий по нарастающей трудности сохраняется и для большинства современных психометрических тестов, направленных на исследование общих способностей, профессиональной успешности, тестов достижений и ряда других.
В тестах скорости, в отличие от тестов результативности (см. Тест), Т. з. т. обычно невысока и практически неизменна. Количество задач в таких методиках заведомо делают таким, чтобы никто из испытуемых в заданное время не успел решить все.
Основным показателем Т. з. т. является индекс трудности
где UT — индекс трудности в процентах, Nn — число испытуемых, правильно решивших задачу, N — общее число испытуемых.
При учете случайного успеха путем угадывания для задачи с предписанным ответом
где NH — число испытуемых, не решивших задачу, m — количество вариантов ответа.
В тех случаях, когда выборка и количество проверяемых пунктов велики, имеется возможность определить индекс трудности с помощью контрастных (крайних) подгрупп. В каждую из подгрупп входят по 27% лиц от численности выборки, имеющих лучшие и худшие результаты по тесту в целом. Индекс Т. з. т. вычисляется как среднее арифметическое индексов трудности для групп с максимальным и минимальным результатом
Если предположить, что частоты распределения оценок испытуемых, выполнивших задание, подчиняются нормальному закону, то в пределах М ± σ находятся около 68% всех испытуемых, за этими пределами — по 16% испытуемых. Эти величины принимаются за пороговые при отборе задач из первичной формы теста. Таким образом, после расчета индексов трудности в первую очередь исключаются задачи, которые решили более 84% (М - σ) и с которыми не справились 84% испытуемых (М + σ) (рис. 74).
Рис. 74. Пороговые частоты случаев правильного и ошибочного решения при отборе задач по индексу трудности
Более дифференцированным способом анализа Т. з. т. является использование в качестве принципа разделения испытуемых на группы внешнего критерия валид-ности, напр, продуктивности в реальной деятельности. Отбор заданий по показателям трудности может производиться параллельно расчетам коэффициентов корреляции (см. Корреляции коэффициенты дихотомические).
Дата добавления: 2015-07-10; просмотров: 62 | Нарушение авторских прав