Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Надежность теста и проблема угадывания правильного ответа

Читайте также:
  1. B) разность в массе посаженного в печь куска теста и выпеченного хлеба
  2. I. Задания закрытой формы с одним правильным ответом. Обведите букву правильного ответа.
  3. I. Итоговая государственная аттестация включает защиту бакалаврской выпускной квалификационной работы
  4. II. Проблема национальности. Восток и запад
  5. III) Возможность, необходимость и проблематика антикризисного управления
  6. III. Форма Государственной (итоговой) аттестации
  7. IV. Порядок проведения Государственной (итоговой) аттестации

Достаточно надежный тест позволяет получить устойчивую оценку спо­собностей испытуемых той группы, к которой он применяется.

Надежность теста как средства измерений определяется отсутствием ошибок измерения тестовых баллов и тем, в какой мере результаты изме­рений воспроизводятся при многократном использовании теста по отноше­нию к данной группе испытуемых. Ошибки измерения возникают в связи с усталостью испытуемого, нервным напряжением, содержанием включенных в тест заданий, ошибочными ответами, неправильной интерпретацией инструкций и попытками угадать ответ. Эти ошибки снижают индивидуаль­ные результаты испытуемого и надежность теста.

А. Анастази выделяет случайные ошибки, вызванные невнимательнос­тью или незнанием учащегося, и истинные ошибки, то есть ошибки, допу­щенные в конструкции теста. С этой точки зрения надежность показывает, в какой степени индивидуальные различия вызваны истинными, а какие случайными ошибками.

Чтобы оценить вклад различных источников в ошибку измерения, необ­ходимо использовать разные способы оценки надежности. Прежде всего это ретестовая надежность. Для этого тест используют второй раз, и коэффи­циент надежности в этом случае равен корреляции между результатами, по­лученными на одних итех же испытуемых в каждом из случаев проведения теста. Конечно же, какой-то процент колебаний результатов теста может быть вызван не только результатами теста, но и некоторыми отвлекающими мо­ментами: самочувствием, эмоциональным состоянием и т.д. Тем не менее чем выше ретестовая надежность, тем менее чувствительны результаты к обычным изменениям состояния испытуемого и обстановке тестирования.

Ретестовая надежность зависит от интервала времени, в котором она происходит. С увеличением времени данный вид надежности уменьшает­ся. С другой стороны, если промежуток времени невелик, то испытуемые припоминают свои прежние ответы. В этом случае обследуемые указыва­ют примерно одинаковые правильные и неправильные ответы и коэффи­циент корреляции окажется обманчиво высоким.

Другой способ определения надежности - метод расщепления. В этом случае каждый испытуемый получает два результата при разбивке теста на две сопоставимые части. При такой методике надежность является ме­рой согласованности выборок содержания. Временная стабильность пока­зателей в ней не представлена, так как применяется только один сеанс тестирования. Благодаря этому метод расщепления иногда называют ко­эффициентом внутренней согласованности.

Еще одним способом определения надежности является надежность взаимозаменяющих форм. При этом те же самые испытуемые первый раз те­стируются с помощью одной формы теста, второй раз - с помощью другой, сравнимой формы. Корреляция между показателями, полученными по этим двум формам, и служит коэффициентом надежности теста. При этом изме­ряется как временная стабильность теста, так и согласованность ответов по двум выборкам заданий.

Кроме указанных видов надежности можно выделить также метод Кью-дера - Ричардсона.и другие статистические методы, описанные в специ­альной литературе.

А.Н. Майоров определяет целый ряд факторов, оказывающих влияние на надежность тестового инструментария.

1. Величина теста. Чем длиннее тест, тем он надежнее. Выше отме­чалось, что общая оценка теста состоит из истинной составляющей и ошибочной. Истинная составляющая, несомненно, больше ошибочной, и чем больше заданий в тесте, тем скорее сумма истинной составляющей будет возрастать, а ошибочной, соответственно, уменьшаться.

2. Непонятность и двусмысленность заданий. Непонятные и дву­смысленные задания приводят к тому, что ответы на них даются случай­ным образом. То есть в двух тестированиях будут получены разные резуль­таты, таким образом, корреляция между результатами тестирований сни­зится и, следовательно, надежность будет низкой.

3. Источники, связанные с испытуемыми: невнимательность, со­стояние здоровья и т.д. Все эти факторы снижают надежность тестирова­ния. Однако в том случае, когда выборка для апробации теста достаточно велика, а инструкция для проведения четко определяет условия проведе­ния, то многого из перечисленного удается избежать.

4. Субъективное оценивание. Результаты выполнения заданий должны оцениваться одинаково разными проверяющими. Другими словами, правиль­ный ответ в тесте должен быть однозначным. В том случае, если это требова­ние будет нарушено, то будут допускаться различия между оценками разных проверяющих и между оценками одного проверяющего в разных случаях. Как следствие различных оценок корреляция между результатами выполнения тестирования будет уменьшена и надежность теста будет невысокой.

5. Ошибки в подсчетах. В том случае, если задания имеют однознач­ную схему оценивания, причиной неудовлетворительной надежности мо­гут стать случайные ошибки при подсчете баллов, их суммировании.

6. Инструкции для учащихся. В том случае, если задания имеют не­ясные, двусмысленные инструкции, то результаты двух тестирований бу­дут существенно различаться, а надежность окажется невысокой.

7. Инструкции к тесту могут быть причиной низкой надежности. Ин­струкции должны обеспечивать одинаковость процедуры проведения тес­тирования, быть понятными и недвусмысленными. Если условия проведе­ния тестирования в одном случае отличаются от другого, то и корреляция результатов тестирования в этих случаях будет невысокой.

8. Случайное угадывание правильных ответов также является причи­ной снижения надежности теста.

Остановимся на данной проблеме подробнее.

Один из доводов критиков тестирования заключается в том, что для боль­шинства заданий существует вероятность случайного угадывания правиль­ных ответов. В общем случае это проблема только заданий закрытого типа, и чем меньше возможных альтернатив предлагается испытуемому в рам­ках одного задания, тем больше вероятность угадывания. Однако для за­даний альтернативных ответов, используемых одиночно, вероятность уга­дывания максимальна и составляет 50%. Исследователи настоятель­но не рекомендуют использовать такие задания для тестов школьных достижений. Серия из пяти заданий альтернативных ответов дает вероят­ность угадывания 0,0313, а из десяти заданий - всего лишь 0,00098.

Проблема угадывания зависит и от времени, выделяемого на тестиро­вание, и в меньшей степени, от мотивации. Чем выше мотивация, тем боль­ше вероятность того, что испытуемый попытается дать ответ случайно на те вопросы, на которые он не успевает ответить, то есть попытается уга­дать. В свою очередь, количество вопросов, по которым возможно будет угадывание, зависит от времени, выделяемого на тестирование. Чем оно короче, тем больше будет вопросов, на которые распространится случай­ное угадывание. Таким образом, для времени, выделяемого на тестирова­ние, должен быть найден баланс: недостаток его ведет к угадыванию, из­быток - к подсказкам и ослаблению дисциплины.

 


Дата добавления: 2015-07-25; просмотров: 819 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Выборка стандартизированного педагогического теста| Валидность тестовых результатов

mybiblioteka.su - 2015-2024 год. (0.006 сек.)