Читайте также: |
|
(LeistungsmotivsGitter) — проективная методика исследования личности. Разработана и опубликована Г. Д. Шмальтом в 1976 г. Предназначена для диагностики интенсивности и экстенсивности мотива достижения, близка тематической апперцепции тесту в его модификации по X. Хекхаузену.
Стимульный материал М. д. р. состоит из 18 картинок, объединенных в тройки,
относящиеся к шести различным сферам жизнедеятельности (труду, музыке, школьному обучению, самоутверждению, оказанию помощи, спорту). На рис. 45 см. в качестве примера картинки из сферы спорта и школьного обучения (вариант для обследования детей). Под каждой картинкой располагаются 18 стандартных высказываний, напр.:
— Он хорошо себя чувствует;
— Он думает: «Раз это трудно, то попробую еще»;
— Он считает, что справится с этим;
— Он думает: «Может быть опять неудача»;
— Он думает: «Я лучше сделаю что-нибудь потруднее».
Обследуемый должен отметить те высказывания, которые соответствуют его пониманию ситуации на картинке.
За исключением 4-х т. н. «избыточных» утверждений (напр., «Он хорошо себя чувствует* или «Это ему не нравится») 14 репрезентируют ключевые категории для обработки содержания при выявлении мотивов успеха и неудачи. Напр.: «Он думает, что все сделал правильно» — позитивное ожидание успеха.
Обработка результатов сводится к об>единению всех отмеченных утвержде-
Рис. 45. Две из 18 ситуаций, изображенных на картинках Мотива достижения решетки, вариант
для детей
ний по каждой из картинок с целью получения матрицы ответов (отсюда название методики — «решетка»). Столбцы этой матрицы представляют интенсивность мотива (разнообразные высказывания, относящиеся к одной и той же картинке), а строки — его экстенсивность (одни и те же высказывания по отношению к разным картинкам). При помощи факторного анализа установлена принадлежность каждого из утверждений к одной из моти-вационных тенденций, обозначаемых как НУ, БН1 и БН2. НУ — уверенность в успехе, предпочтение более трудных проблем и «Я»-концепция достаточного развития собственных способностей; БН1—активное избегание неудачи и «Я»-концепция недостаточного развития способности; БН2 — боязнь неудачи.
При изучении валидности М. д. р. выявлена тесная связь с Хекхаузена модификацией ТАТ. Надежность ретестовая при интервале между обследованиями от 2 до 8 недель — 0,67-0,85. Существуют варианты М. д. р. для обследования детей и взрослых.
Данных об использовании в СНГ нет.
МОТИВАЦИИ АНАЛИЗА ТЕСТ (Motivation Analysis Test, MAT) — тест-объективный личности. Разработан Р. Кэттеллом и Д. Чайлдом в 1975 г.
Опросник включает 208 пунктов, состоит из четырех субтестов, содержащих разные типы заданий:
1 субтест содержит 48 заданий с предложенными вариантами ответов. В этих заданиях описывается некоторая ситуация, в которой следует решить, как лучше потратить деньги, распорядиться временем, использовать те или иные предметы;
2 субтест содержит 56 заданий, в которых необходимо произвести определенную оценку с помощью 4-балльной шкалы, напр.: «Какой процент взрослых людей будут рады отдать деньги на...»;
3 субтест содержит 48 пар слов, к каждой из которых предлагается ключевое слово. Испытуемый должен решить, какое из двух слов в паре наилучшим образом подходит к ключевому;
4 субтест оценивает информированность субъекта в области повседневных жизненных задач.
В методике измеряются две группы показателей: «эрги» (основные тенденции личности) и «чувства» (культурально-сформированные тенденции). Кчислу первых относятся направленность на поиск партнера, уверенность в себе, нарциссизм (поиск комфорта), неуживчивость. Кгруп-пе измеряемых «чувств» относятся уровень супер-эго (совести), отношение к себе, отношение к партнеру, карьере и родительскому дому. В факторах «эргов» и «чувств» содержатся два компонента, «не-интегрированный» и «интегрированный», по мнению разработчиков приблизительно соответствующие бессознательному и сознательному аспектам психической активности. Последние два субтеста направлены на измерение интегрированных компонентов личностных тенденций. Основой для их разработки стало положение Р. Кэттелла и Д. Чайлда (1975), что люди знают больше о тех предметах, с которыми связаны их интересы, и, следовательно, будут располагать о них большей информацией, чем о других (4 субтест), и, вероятнее всего, будут ассоциировать слова с областью своих интересов (3 субтест).
Авторы теста полагают, что испытуемые не имеют представления о тех психологических показателях, которые исследуются тестом (на этом основании методика относится к объективным тестам).
Показатели надежности М. а. т. недостаточно удовлетворительны. Так, коэффициент альфа варьирует от 0,33 до 0,71. Валидность являлась предметом исследований Р. Кэттелла и соавт. (1970), которые приводят данные о ее высоких показа-
телях (на основании сопоставления с результатами «Шестнадцати личностных факторов» опросника). Однако эти результаты ставятся под сомнение (К. Бурд-селл, 1975). В исследовании П. Клайна и Дж. Гриндлей (1974) валидность подтверждается соответствием между результатами этого теста и анализом дневниковых материалов испытуемых.
Исследования К. Купер и П. Клайна (1982) заставляют усомниться в валидности М. а. т. (в психометрическом аспекте). Факторный анализ М. а. т. и шкал 16 PF был осуществлен на выборке из 109 мужчин. Исследование выявило восемь факторов, ни один из которых не соответствовал постулированной структуре теста. В качестве дальнейшей проверки был проведен анализ, в котором было продемонстрировано, что шкалы не являются однородными (задания не соответствовали шкалам, которым они приписывались). Руководство к тесту сопровождается нормами, рассчитанными для американской выборки (объем выборки незначительный).
По мнению П. Клайна, тест представляет интерес, поскольку относится к весьма немногочисленной группе объективных тестов и к тому же является стандартизированным. Тем не менее тест недостаточно доработан и в настоящем виде не может быть рекомендован к применению в психодиагностических исследованиях.
Сведений об использовании в СНГ нет.
МЫШЛЕНИЯ ПРОСТРАНСТВЕННОГО ТЕСТ — тест специальных способностей. Предложен И. С. Якиманской, В. Г. Зархиным и X. М. Кадаяс в 1991 г. Предназначен для диагностики уровня развития пространственного мышления.
М. п. т. включает пять субтестов, задания которых требуют от испытуемых в процессе создания образа работы с величиной объектов (1), их формой (2), а также оперирования образами, приводящего к мысленному видоизменению положения объекта (3), его структуры (4), к одновременному изменению пространственного положения и структуры образа (5). Два вида заданий направлены на выявление процесса создания образа и три — на фиксацию типов оперирования образом. Внутри субтестов задания различаются по материалу (черчение, геометрия, рисование). Тест имеет две формы (А и Б), каждая из которых состоит из 5 видов заданий. Каждый вид заданий представлен двумя вариантами, различающимися уровнем сложности.
Надежность ретестовая (3,5 мес) — 0,841 прир < 0,01. Валидность определялась: сравнением успешности выполнения заданий со школьной оценкой по геометрии (г = 0,683, р < 0,01); сопоставлением результатов выполнения заданий М. п. т. и субтеста № 8 Амтхауэра интеллекта структуры теста (г = 0,623, р < 0,01); путем сравнения результатов тестирования с успешностью выполнения стандартизированной контрольной работы по геометрии (г = 0,697, р < 0,01). Доказана эквивалентность форм А и Б (г = 0,959, р < 0,01). Разработана схема качественного анализа результатов тестирования.
Авторы считают, что с помощью теста можно выявить не только индивидуальные различия в содержании и структуре пространственного мышления, но и конструировать обучающие коррекционные программы с учетом всех структурных компонентов этого вида мышления, их взаимосвязи и компенсируемости.
Н
НАДЕЖДЫ ИНДЕКС (Hope Index) —
опросник личностный, предназначен для диагностики мотивационной сферы личности, ее отношения к будущему. Разработан С. Стаатс и М. Стассен в 1986 г.
Стимульный материал представляет собой бланк с перечнем 16 наиболее распространенных желаний, которые были выявлены в ходе предварительных опросов. Испытуемый должен оценить в 6-балльной Лайкерта шкале и указать в баллах от 0 до 5: 1) насколько он хочет осуществления каждого желания (от 0 — «совсем не хочу» до 5 — «хочу очень сильно*»); 2) какова вероятность осуществления каждого желания (от 0—«очень низкая» до 5 — «очень высокая*). Испытуемый может добавить к списку 1 -2 желания.
Общий показатель надежды представляет собой сумму баллов «желания», умноженных на количество баллов «ожидания» по каждому пункту. Шкала надежды имеет субшкалы «надежды-для-себя» (напр., иметьхорошее здоровье), «надежды -для-других» (напр., «иметь больше друзей», «понимание в семье»), «надежды-для-всех» (напр., «мир во всем мире»); по другому основанию деления — субшкалы «желание» и «ожидание».
Надежда, диагностируемая по Н. и.,
определяется как результат взаимодействия желаемого и ожидаемого (С. Стаатс, М. Стассен, 1986). При этом с помощью Н. и. диагностируются в первую очередь когнитивные аспекты надежды (см. Ожидаемого баланса шкала). Теоретической основой методики является концепция триады «я—другие—мир» А. Бека (1967), описывающая взаимодействие человека с окружающим миром.
Надежность ретестовая Н. и. при обследовании 112 испытуемых-студентов с интервалом 9 недель составила rt = 0,62-0,74; внутренняя согласованность (при обследовании 130 испытуемых студентов) — 0,72-0,85. Н. и. обладает достаточно высокой валидностью.
Сведений об использовании в СНГ не имеется.
НАДЕЖНОСТИ КОЭФФИЦИЕНТЫ — статистические показатели надежности психологического теста.
При оценке надёжности наиболее часто применяются различные виды корреляционного анализа. В качестве Н. к. при характеристике надежности ретес-товой используются коэффициенты корреляции результатов первичного и по-
вторного обследования, при оценке надежности параллельных форм. — коэффициент корреляции результатов, полученных с помощью разных форм теста (см. Параллельные формы теста).
При оценке надежности частей теста находят применение специальные коэффициенты, полученные на основе урав-нений Кьюдера—Ричардсона, Спирме-на—Брауна. Распространенным методом анализа надежности является расчет коэффициента «альфа». При характеристике надежности факторно-дисперсионной используются специальные методы дисперсионного анализа.
Н. к., определенные на основе разных подходов, нередко существенно отличаются по своим эмпирическим значениям. Между разными моделями определения надежности могут отмечаться противоречия (см. Надежность по внутренней согласованности). Имеется ряд сложностей количественной характеристики надежности, аналогично проблемам, возникающим при анализе содержания ва-лидности коэффициентов.
Несмотря на то что количественные характеристики надежности в виде традиционного Н. к. более распространены в практике психодиагностики, нежели количественные коэффициенты при оценке валидности, о надежности теста следует (как и в случае валидности) судить на основании изучения разных аспектов. При интерпретации Н. к. обязателен учет закономерностей разных подходов к определению надежности н психологический анализ показателей проверяемого на надежность теста.
НАДЕЖНОСТЬ — характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов. Н. и валидность являются важнейшими ха-
рактеристиками методики как инструмента психодиагностического исследования.
Результат психологического исследования обычно подвержен влиянию большого количества неучитываемых факторов (напр., эмоциональное состояние или утомление, если они не входят в круг исследуемых характеристик, освещенность, температура и другие особенности помещения, в котором проводится исследование, уровень мотивированности испытуемых на обследование и др.). Любое изменение ситуации исследования усиливает влияние одних и ослабляет воздействие других факторов на результат теста.
Общий разброс (дисперсию) результатов тестового обследования можно, таким образом, представить как результат влияния двух групп причин: изменчивости, присущей самому измеряемому свойству, и факторов нестабильности измерительной процедуры.
В самом широком смысле Н. теста — это характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отражением действительных различий в измеряемых свойствах и в какой мере они могут быть приписаны случайным ошибкам.
В более узком, методическом, смысле под Н. понимают степень согласованности результатов теста, получаемых при первичном и вторичном его применении, у одних и тех же испытуемых в различные моменты времени, с использованием разных (но сопоставимых по характеру) наборов тестовых заданий или при других изменениях условий обследования.
Распределение оценок испытуемых при выполнении теста, измеряющего одно качество, в идеальном случае совпадает с нормальным распределением, и дисперсия при этом будет «истинной» (т. е. отражающей вариативность только измеряемого признака). Каждый испытуемый занимает определенное место по оценкам
теста, и теоретически это место для каждого члена выборки постоянно. В рассматриваемом случае повторное выполнение теста теми же лицами должно давать распределение мест на шкале оценок, идентичное первому. Тогда методика точна и максимально надежна. Реальные оценки и ранговые места испытуемых при повторном обследовании изменяются, и их распределение в той или иной степени отличается от исходного. При этом дисперсия нового распределения выше исходного на величину дисперсии ошибки измерения. Сказанное можно выразить формулой, описывающей Н. теста как отношение «истинной» и реальной (эмпирической) дисперсии:
5? а = |г.
или
Величина ошибки измерения обратно пропорциональна показателям точности измерения (чем шире доверительный интервал, внутри которого возможно появление истинного результата у данного ис-
На практике в большинстве применяемых методик редко удается получить значения коэффициентов Н., превышающие 0,7-0,8. При rt порядка 0,8 относительная доля стандартной ошибки (см. О шибка измерения) составляет ^1 - 0,8 = 0,45, а эмпирическое значение отклонения тестового балла от среднего оказывается завышенным. Для коррекции эмпирического значения в практических исследованиях применяется формула:
xt = rlxi+x(\~rt),
где xt — истинное значение тестового балла, xi — эмпирический балл испытуемого, г( — коэффициент ■ надежности, х — среднее значение оценок по тесту.
Напр., у испытуемого при обследовании по шкале Векслера (см. Векслера интеллекта измерения шкалы) оценка вербального интеллектуального показателя составила 107 баллов. Среднее значение" х для шкалы составляет 100, а надежность г{ — 0,89. При этом истинное значение х, = 0,89 ■ 107 + 0,11 ■ 100 - 106,2.
Разновидностей характеристик Н. теста так же много, как условий, влияющих на его результаты. Наиболее широкое практическое применение находят несколько типов характеристик Н.: надежность ре-тестовая, надежность параллельных форм, надежность частей теста.
Подчеркивается, Что ни одна из существующих процедур не является идеальной с т. з. Н. Свойства Н. могут существенно изменяться при незначительных, на первый взгляд, изменениях условий проведения обследования, изменении ха-
рактера заданий, они значительно варьи* руют в зависимости от степени сложности или трудности конкретных заданий для испытуемого. Стандартный набор сведений о психодиагностических методах обычно включает характеристики Н., относящиеся к комплексу приведенных выше типов и процедур определения.
На характеристики Н., определяемые эмпирическим путем, существенно влияет характер исследуемой выборки. Особое значение здесь имеет диапазон различий в оценках и соответственно в ранговых местах отдельных испытуемых и их групп в выборке определения Н. Так, если оценки обследуемых концентрируются в узком диапазоне значений и близки друг другу, следует ожидать, что при повторном обследовании оценки также расположатся в тесной гомогенной группе. Возможные изменения ранговых мест будут внешне незначительны, и в таком случае коэффициент Н. будет завышен. Такое же неоправданное завышение коэффициента может возникнуть при анализе Н. на материале выборки, включающей контрастные группы лиц, напр, имеющих самые высокие н самые низкие оценки по тесту. Тогда эти далеко отстоящие оценки заведомо не будут перекрываться под воздействием случайных причин.
В практике психодиагностики при разработке руководств и методик обычно указывается характер групп, на которых проводилось определение Н. Коэффициенты Н. нередко рассчитываются для конкретных контингентов испытуемых, различающихся по полу, возрасту, уровню образования, профессиональной подготовке. Нередко производят расчет Н. раздельно для групп испытуемых, получивших по тесту высокий или низкий результат (см. Станфорд—Бине умственного развития шкала).
Важнейшим средством повышения Н. психодиагностических методик является
стандартизация процедуры обследования. При строгой регламентации процедуры обследования (обстановка и условия работы испытуемого, характер инструкции, временные ограничения, способы и особенности контакта с испытуемым, порядок предъявления элементов методики, получения оценок первичных и т. д.) существенно уменьшается дисперсия ошибки и повышается Н. теста.
Если исходить из широкого понимания Н. как отражения в результате исследования удельного веса измеряемого параметра и совокупности посторонних факторов, то можно усмотреть определенную связь Н. с другой важнейшей комплексной характеристикой психодиагностической методики — валидностью.
Н. — устойчивость процедуры относительно объектов исследования. Валид-ность — однозначность, устойчивость относительно измеряемых свойств объекта (т. е. предмета измерения). Устойчивость теста относительно объектов (испытуемых) является необходимым, но не достаточным условием его устойчивости относительно измеряемых свойств объектов. Следовательно, Н. является необходимым, но не достаточным условием валид-ности. Это означает, что валидность теста не может качественно и количественно превышать Н. Данное соотношение нельзя, однако, трактовать как указание на прямую пропорциональную связь характеристик валидности и Н. Повышение Н. отнюдь не сопровождается обязательным повышением валидности. Напр., у теста-опросника из одного вопроса внутренняя согласованность предельна, однако валидность у него минимальна.
НАДЕЖНОСТЬ ПАРАЛЛЕЛЬНЫХ ФОРМ — характеристика надежности психодиагностической методики с помощью взаимозаменяемых форм теста (см. Параллельная форма теста). При этом
одни и те же испытуемые в выборке определения надежности обследуются вначале с использованием основного набора заданий, а затем — с применением аналогичных дополнительных наборов. Коэффициент надежности по типу Н. п. ф. может быть определен и другим способом, а именно: испытуемые делятся примерно на равные группы, затем одной из них предлагается форма А теста, а другой — форма Б. Через определенное время (обычно не более недели) проводится повторное тестирование, но в обратном порядке.
Такая процедура обследования лишена значительной части недостатков способа определения надежности ретесто-вой. Так как в параллельной форме используется другой по содержанию материал, возможность тренировки и запоминания отдельных решений уменьшается. Важнейшим преимуществом данного метода является сокращение временного интервала перед повторным обследованием. Основным показателем Н. п. ф. является коэффициент корреляции между результатами первичного и повторного обследований, который позволяет оценить как временную стабильность теста (собственно надежность), так и степень соответствия результатов обеих форм теста. Если формы применяются непосредственно одна за другой, то корреляция отражает их взаимозаменяемость.
Отношение между параллельными формами теста имеет сложный характер. Оба набора заданий должны не только отвечать одним и тем же требованиям, измеряя идентичные показатели и давая сходные результаты, но вместе с тем быть относительно независимыми друг от друга. На практике эта задача осуществима далеко не для всех тестовых заданий (в особенности это касается личностных методик, опросников), что существенно ограничивает сферу применения Н. п. ф. Дру-
гим недостатком характеристики надежности по типу Н. п. ф. является возможность усвоения испытуемым принципа решения, общего для основной и параллельной форм. Таким образом, в случае оценки Н. п. ф. влияние тренировки и навыка, приобретаемого при повторном обследовании, если и снижается по сравнению с характеристикой надежности ретестовой, однако не устраняется полностью.
НАДЕЖНОСТЬ ПО ВНУТРЕННЕЙ СОГЛАСОВАННОСТИ — способ определения надежности, опирающийся на оценку степени выраженности интеркорреляционных связей между заданиями, составляющими тест.
В данном случае истинный показатель по тесту понимается как результат, который получил бы испытуемый, если бы ему были предъявлены все возможные задания, относящиеся к черте или свойству, являющемуся объектом тестирования. Каждый конкретный тест является выборкой из генеральной совокупности заданий. Погрешность измерения отражает степень, в которой реальная выборка заданий охватывает теста заданий совокупность генеральную. Генеральная совокупность заданий порождает бесконечно большую корреляционную матрицу парных связей между заданиями. Среднее значение корреляции между заданиями для этой матрицы (Тц) указывает на степень общности, внутренней согласованности, заданий. Так, если, например, в тесте было бы одно задание из множества независящих друг от друга, то ?ц ~ 0,00. Предполагается, что все задания имеют одинаковые значения взаимной корреляции.
Исходя из основных положений оценки Н. п. в. с, можно сказать, что корреляция некоторого задания с истинным показателем (г.() равна квадратному корню от
его средней корреляции с другими заданиями (Дж. Наннелли, 1978):
строго говоря, этот вывод справедлив тогда, когда количество заданий приближается к бесконечности.
С точки зрения разработчика теста, соотношение r.t и г.. имеет важное значение, поскольку при разработке значительного количества заданий и выборе из них тех, для которых значение лГц будет наибольшим, созданный тест будет надежным и свободным от погрешностей измерения. Аналогичные рассуждения, касающиеся взаимосвязи заданий, могут быть применены к надежности параллельных форм тестов. В данном случае каждый из параллельных тестов рассматривается как случайная выборка из генеральной совокупности заданий. Средние значения и дисперсии тестов отличаются от истинного показателя только случайным образом. Следовательно, в приведенном выше уравнении значения для заданий могут быть заменены показателями для тестов (т. е. наборов заданий).
Так как корреляции между заданиями или параллельными тестами на практике не являются идентичными, должно быть некоторое распределение их вокруг истинного значения. Если предположить, что такое распределение является нормальным (см. Нормальное распределение), можно оценить точность коэффициента надежности Тц путем вычисления стандартной ошибки (см. Ошибка измерения) средней взаимной корреляции заданий или тестов в генеральной совокупности (Дж. Наннелли, 1978):
ций задании внутри теста ил — количество заданий в тесте.
Из уравнения видно, что по мере возрастания стг. возрастают различия между корреляциями и по мере возрастания п стандартная погрешность уменьшается, то есть чем больше заданий, тем выше точность оценки коэффициента надежности. Действительно, если предположить, что сгг для некоторого теста равна 0,15, а количество заданий варьирует от 10 до 30, то, подставив соответствующие значения в уравнение, получим следующие погрешности: для теста из 10 заданий — 0,02; для теста из 20 заданий — 0,01; для теста из 30 заданий — 0,007.
Вслед за Дж. Наннелли (1978), П. Клайн (1986) распространяет суждение о возрастании точности коэффициента надежности при увеличении состава теста и на саму величину надежности. В самом деле, поскольку истинные показатели теста определяются через меру представленности заданий генеральной совокупности, должно выполняться предположение о том, что чем больше тест, тем выше корреляция с истинным показателем. Предельным случаем будет гипотетическая ситуация, когда тест состоит из всех заданий генеральной совокупности за исключением одного. Для доказательства надежности теста, задания которого, как заранее известно, принадлежат одной генеральной совокупности, можно воспользоваться формулой Спирмена— Брауна:
где rt — надежность теста, п —- количество заданий, Ц, — средняя взаимная корреляция заданий. В формуле Спирмена Брауна показатель г,' (см. Надежность частей теста) заменен на Тц, что вытекает из вывода модели коэффициента надежности.
Предположим, имеются три набора заданий (п = 10, 20, 30), средняя корреляция между которыми равна 0,20, тогда:
10-0.20 nRfi7 О667
Причем эти показатели получены для заданий, взаимная корреляция которых была низкой. Для более однородного теста из 30 заданий при 7ц = 40 получаем:
Таким образом, при наличии набора однородных заданий тест будет заведомо надежным. Даже если разделить совокупность заданий на две параллельные формы по 15 пунктов, они обе также будут иметь удовлетворительную надежность.
Теоретические значения коэффициента надежности при данном способе определения существенно превышают эмпирические значения надежности ретесто-вой и надежности параллельных форм. Это происходит из-за ряда допущений. Прежде всего следует указать на то, что при определении Н. п. в. с. не учитываются другие источники погрешности измерений, связанные с неконтролируемыми факторами среды, состояния и мотивации испытуемого (см. Надежность). В этой связи между Н. п. в. с. и ретестовой надежностью имеется противоречие. Ретес-товая надежность может уменьшаться при увеличении состава заданий (чем больше заданий, тем выше вероятность случайного или закономерного изменения ответа при ретесте). Противоречие может быть снято за счет признания некорректности допущения о равенстве интеркорре-
ляций между заданиями, зависимости погрешности лишь от представленности в тесте генеральной совокупности заданий. В противном случае необходимо было бы согласиться с тем, что в двух тестах, связанных общим фактором и имеющих одинаковое количество заданий, но совершенно разных по характеру выполнения и трудности, надежность будет одинаковой, что невозможно.
Следует обратить внимание на невозможность определения таким способом надежности тестов скорости, так как связь каждого из заданий исследуемой генеральной совокупности не определена из-за большого количества заданий, интеркорреляции заданий могут терять смысл (см., напр., Корректурная проба).
Важным аспектом оценки применимости Н. п. в. с. является парадокс, возникающий в этом случае при сочетании показателей надежности и валидности теста. Кажется, что высокая внутренняя согласованность должна быть основной целью разработчиков теста (Л. Кронбах, 1920). Такая точка зрения является довольно распространенной. Однако Р. Кэт-телл (1977) обоснованно утверждает, что высокая внутренняя согласованность (особенно при изучении сложных психологических конструктов, личностных показателей) в известном смысле противостоит высокой валидности.
Возникающее противоречие можно иллюстрировать следующим примером. Тест вербальных способностей может включать задания (и соответственно, субтесты) на подбор антонимов, синонимов, понимание слов, словарный запас. Предположим, что каждый из субтестов имеет высокие показатели Н. п. в. с. Однако если бы мы воспользовались только одним субтестом (например, подбором антонимов), то показатель Н. п. в. с. теста несомненно возрос бы по сравнению с полным набором субтестов, так как используется
только один тип высокосогласованных заданий. Высокая надежность субтеста антонимов будет отражать тот факт, что эта выборка заданий в высокой степени коррелирует с гипотетической генеральной совокупностью заданий на антонимы. Однако этот истинный показатель отражает не вербальные способности, а только способность подбирать антонимы (т. е. валид-ность теста станет низкой по отношению к измерению вербальных способностей). Приведенные данные свидетельствуют о специфичности применения каждого из имеющихся подходов к характеристике надежности теста. Н. п. в. с. имеет, очевидно, в основном теоретическое значение. Как и надежность частей теста в предельном случае разбивания материала на отдельные задания, рассматриваемый способ имеет практическое значение для оценки точности коэффициента надежности, а также при характеристике некоторых тестов, состоящих из специально подобранных факторизованных заданий (см. Факторно-аналитический принцип).
НАДЕЖНОСТЬ РЕТЕСТОВАЯ — характеристика надежности психодиагностической методики, получаемая путем повторного обследования испытуемых с помощью одного и того же теста. Надежность в этом случае вычисляется по соответствию результатов первого и второго обследований или по сохранению ранговых мест испытуемых в выборке при ретесте. Коэффициент надежности (г) соответствует коэффициенту корреляции между результатами таких обследований. При использовании интервальных шкал (см. Шкалы измерительные) применяется коэффициент корреляции произведения моментов Пирсона (см. Корреляционный анализ). Для шкал порядка в качестве меры устойчивости к перетестированию может быть использован коэффи-
циент ранговой корреляции Спирмена или Кэндалла (см. Корреляция ранговая).
При характеристике Н. р. особое значение имеет временнбй интервал между первым и вторым обследованиями. С его увеличением показатели корреляции имеют тенденцию к снижению, существенно повышается вероятность воздействия посторонних факторов — могут наступить закономерные возрастные изменения измеряемых тестом свойств, произойти различные события, влияющие на состояние и особенности развития исследуемых качеств. По этой причине при определении Н. р. стараются выбирать непродолжительные временные интервалы (до нескольких месяцев), а при обследовании детей младшего возраста эти интервалы должны быть еще меньше, поскольку возрастные изменения и развитие в этом случае происходят еще быстрее.
Несмотря на указанную тенденцию, при получении характеристик теста проводятся повторные испытания и с длительным временным промежутком. Иногда они осуществляются в целях оценки валидности прогностической, элементов валидности конструктной, связанных с дифференциацией по возрастному критерию и др. Определение же Н. р. главным образом ограничивается анализом краткосрочных случайных изменений, характеризующих тест как измерительную процедуру, а не его отношение к исследуемой области поведения.
Наряду с очевидной простотой Н. р. как метод определения надежности обладает существенными недостатками. Так, при повторном применении одних и тех же заданий, особенно при относительно непродолжительном временном интервале между обследованиями, у испытуемых может сформироваться навык работы с данной психодиагностической методикой, что приводит к улучшению индивидуальных результатов, хотя и не одинаково вы-
раженному у разных лиц. Это неизбежно ведет к заметной перестановке ранговых мест отдельных испытуемых в данной выборке и, соответственно, ухудшению коэффициента надежности. Еще более заметное воздействие на результаты анализа надежности оказывает запоминание испытуемыми отдельных решений, воспроизведение в повторном обследовании предыдущей картины правильных и неправильных решений. В этом случае результаты двух предъявлений теста не будут независимыми и корреляция между ними окажется завышенной.
Один из путей устранения влияния тренировки на результаты оценки Н. р. — формирование устойчивого навыка в работе с соответствующей методикой перед проведением тест-ретеста. Однако количество повторений теста при этом неизбежно возрастает, что приводит к увеличению числа запомнившихся решений. Такой прием может быть рекомендован для методик типа тестов скорости, содержащих большое количество элементов тестового материала.
Для других методик, очевидно, единственным приемлемым путем снижения влияния тренировки остается увеличение интервала ретеста, что, однако, как уже говорилось выше, вступает в противоречие с определением надежности как характеристики теста.
Для большинства тестов общих способностей характерно улучшение показателей Н. р. с возрастом испытуемых за счет лучшего контроля условий их выполнения. Другим фактором увеличения расчетных показателей Н. р. является относительное замедление с возрастом темпа психического развития в области тех характеристик, которые могут стать объектом измерения или влиять на результат теста. Благодаря этому, спустя время, составляющее интервал ретеста, случайные колебания результатов обследования ста-
новятся менее выраженными. Это искусственно завышает показатели Н. р. Эта закономерность требует отдельных измерений Н. р. в разных возрастных контин-гентах испытуемых, что особенно существенно для методик, предназначенных для обследования в широком возрастном диапазоне (см. Станфорд—Бине умственного развития шкала, Векслера интеллекта измерения шкалы).
Указанные особенности и недостатки метода определения надежности путем ретеста делают его пригодным лишь для ограниченного числа методик, допускающих многократное повторное обследование. К их числу относятся сенсомоторные пробы, тесты скорости и ряд других методик, отличающихся большим количеством пунктов (см. Миннесотский многоаспектный личностный опросник).
НАДЕЖНОСТЬ ФАКТОРНО-ДИСПЕРСИОННАЯ — способ определения
надежности, основанный'на дисперсионном анализе результатов теста. Надежность теста соответствует отношению истинной дисперсии (т. е. дисперсии самого исследуемого фактора) к реально полученной эмпирической дисперсии. По-_ следняя складывается из истинной дисперсии и дисперсии погрешности измерения (см. Ошибка измерения). Факторно-аналитический подход к определению надежности дополнительно расчленяет и дисперсию истинного показателя (Дж. Гилфорд, 1956).
Дисперсия истинного показателя, в свою очередь, может состоять из дисперсии общего фактора для групп аналогичных тестов (см. Фактор G), особых факторов, обеспечивающих тесты специфической направленности (см. Факторы групповые) и дисперсии факторов, присущих конкретной тестовой методике. Следовательно, полная дисперсия теста равна сумме дисперсий для общих, специфи-
ческих и единичных факторов плюс дисперсия погрешности:
где ах — доля дисперсии, выраженная общим фактором а, и т. д.
Таким образом, коэффициент надежности теста равен:
Факторно-дисперсионный способ определения надежности подходит для оценки уже факторизованного теста (см. Факторно-аналитический принцип), но не для тестов, измеряющих широкий набор разнообразных параметров, так как некоторые из них могут не входить в установленную область валидности методики.
НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА —
характеристика надежности психодиагностической методики, получаемая путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных пунктов (заданий) теста. Наиболее простым и распространенным способом определения Н. ч. т. является метод расщепления, суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста. Обоснованием метода является вывод о том, что при нормальном или близком к нормальному распределении оценок по полному тесту (см. Нормальное распределение) выполнение любого случайного
набора из частей теста даст аналогичное распределение (при условии, что части однородны по характеру заданий по отношению к тесту в целом).
Для оценки надежности методом расщепления выбирают две эквивалентные по характеру и степени трудности группы задач (см. Внутренняя согласованность, Трудность заданий теста). Разделение объема заданий теста на сопоставимые части достигается:
— распределением заданий на четные и нечетные (в том случае, если задания в тесте строго ранжированы по степени субъективной трудности);
— распределением пунктов по принципу близости или равенства значений индексов трудности и дискриминативно-сти (см. Дискриминативность заданий теста). Такой принцип разделения пригоден для тестов достижений, в которых обязателен ответ испытуемых на все пункты;
— распределением задач по времени решения каждой из частей (для тестов скорости).
Для испытуемых в выборке определения надежности (раздельно для каждой из частей теста) вычисляются оценки успешности решений, среднеквадратические отклонения первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов. Естественно, эти коэффициенты будут характеризовать надежность лишь половины теста.
Уравнение Спирмена—Брауна отражает влияние изменения количества заданий на коэффициент надежности теста:
теста — 100, а его части, полученной методом расщепления на половины, — 50, то п = 0,5). Отсюда для полного теста;
Приведенные формулы справедливы для случаев равных стандартных отклонений обеих половин теста (ох1 = ах2). Если ах1 отличается от ах2, для определения "коэффициента надежности применяется формула Фланагана:
При определении г, целого теста можно воспользоваться формулой Рюлона:
rt = 1 j.
<*х
где о\ — дисперсия разностей между результатами каждого испытуемого по двум половинам теста, ах — дисперсия суммарных результатов. В данном случае коэффициент надежности рассчитывается как доля «истинной» дисперсии результатов теста (см. Надежность, Ошибка измерения).
При расщеплении тестов скорости применяется особая процедура группировки заданий. Определяется минимальное время ((т1п)'решения целого теста, затем отсчитываются половина и четвертая часть этого времени. Все испытуемые работают половину минимального времени, после чего ставят отметку против задания, выполняемого в момент подачи сигнала, и продолжают работать еще четверть минимального времени. Коэффициент надежности в этом случае будет соот-
ветствовать степени корреляции между числом задач, решенных до первого сигнала (0,5fmin) и решенных за время между первым и вторым сигналами (0,25*т|).
Разделение заданий теста на равноценные половины является лишь частным случаем Н. ч. т. Вполне возможно расщепление на три, четыре и более частей. В предельном случае число частей равно числу пунктов. При этом для определения надежности применяют анализ внутренней согласованности.
При разделении всего набора заданий теста на любое количество групп для правильного определения Н. ч. т., как уже указывалось выше, должно соблюдаться требование равноценности таких групп. Поэтому при вычислении коэффициента надежности методом анализа внутренней согласованности отобранные задания теста должны быть в высокой степени однородны по содержанию и трудности (гомогенны). При гетерогенных задачах значения г, ниже истинных:
Наиболее распространенным методом оценки надежности отдельных заданий является вычисление коэффициента Кьюдера—Ричардсона:
Это уравнение может быть упрошено следующим образом:
k
При отсутствии коэффициента дискриминации применим вариант формулы Кьюде ра—Рич ардс он а:
Пример вычислений rt no методу Кьюдера—Ричардсона приведен в табл. 17.
Предложенные выше формулы для определения коэффициента надежности пригодны для случаев, когда задания оцениваются в дихотомической шкале (см. Шкалы измерительные) по принципу «выполнено—не выполнено». Для случаев с более дифференцированной оценкой применима формула коэффициента альфа:
где £сг^. — сумма дисперсий результатов отдельных заданий.
В практике психологической диагностики считается, что тест надежен, если rt > 0,6.
Коэффициент надежности обладает доверительным интервалом, определение которого особенно важно в связи с большим количеством факторов, способных влиять на его значение. Доверительный интервал для г, определяется как
Таблица 17
Определение коэффициента надежности методом Кьюдера—Ричардсона (О = 50; а* = 8,01; k = 16)
Номер | Число лиц, | о | а | РЧ | Вычисление |
задачи | решивших задачу | ч | |||
0,96 | 0,04 | 0,04 | b (ТппЛ | ||
0,86 | 0,14 | 0,12 | |||
0,66 | 0,34 | 0,22 | R l 1, <** ) | ||
0,78 | 0,22 | 0,17 | |||
0,56 | 0,44 | 0,25 | ,i£ I-*»,0,72 151, 8,01 J | ||
0,02 | 0,98 | 0,02 | |||
0,02 | 0,98 | 0,02 | |||
— | — | — | — | tpq = 2,55 |
ристики Н. ч. т. по сравнению с другими типами надежности. К недостаткам метода относится невозможность проверить устойчивость результатов теста спустя определенное время. Это требует комбинирования метода Н. ч. т. с другими типами характеристики надежности психологической методики.
«НАРИСУЙ ИСТОРИЮ» (Draw -a-Stofy, DAS) — проективная методика исследования личности. Предложена Р. Силве-ром в 1987 г. Предназначена для раннего обнаружения депрессии, в частности — скрытой депрессии.
«Н. и.» основывается на обычных для проективных методик положениях: а) детское восприятие одних и тех же рисунков различно; б) на восприятие оказывает влияние личный опыт; в) рисунки могут отражать элементы личности, поддающи-еся квантификации.
В методике комбинируются исследовательские процедуры разных проективных техник. Первоначально обследуемый должен выбрать из 14 картин две и по ним придумать историю (на предлагаемых картинах в основном содержатся изображения людей и животных). Затем необходимо сделать рисунок по мотивам ранее воображенной истории. Наконец, предлагается записать историю. Темы рисунка и истории оцениваются по 7-балльной шкале (от «выраженно негативная» до «выра-женно позитивная»). Негативные темы содержат указания на «грусть», «печаль», «смерть», «беспомощность», «будущее без надежд на лучшее» и т. п. и рассматриваются как знаки депрессии.
«Н. и.» предназначена для группового обследования детей и подростков, начиная с 5-летнего возраста. Сообщается о высокой надежности методики. Так, надежность ретестовая (интервал ретес-та — неделя) при обследовании детей с эмоциональными расстройствами — 0,87.
Данные о валидности ограниченны, тем не менее имеются сведения о том, что темы депрессивных детей и подростков оцениваются в основном как «выраженно негативные», чего не наблюдается в других группах. Имеются нормативные данные, полученные при обследовании 380 детей и подростков, однако они не могут быть признаны репрезентативными. Сведений об использовании в СНГ нет.
«НАРИСУЙ ЧЕЛОВЕКА» ТЕСТ (Draw A-Person Test, DAP) — проективная методика исследования личности. Разработана К. Маховер в1948 г. на основе теста Ф. Гудинаф, предназначенного для определения уровня интеллектуального развития детей и подростков с помощью выполненного ими рисунка мужчины (см. Гудинаф «Нарисуй человека* тест).
«Н. ч.» т. можно использовать для обследования как взрослых, так и детей, допускается групповое обследование.
Обследуемому предлагают карандашом на чистом листе бумаги нарисовать человека. После выполнения рисунка ему дают задание нарисовать человека противоположного пола. Заключительный этап обследования — опрос. К. Маховер составлены специальные перечни вопросов о нарисованных фигурах. Эти вопросы касаются возраста, образования, семейного положения, привычек и т. д.
При интерпретации полученных данных автор исходит из идеи о том, что рисунок является выражением «Я» обследуемого. Значительное внимание уделяется анализу разнообразных деталей рисунка, прежде всего особенностям изображения основных частей тела, которые зачастую оценивают в соответствии с психоаналитической символикой. Изучение валидности «Н. ч.» т. западными психологами привело к противоречивым результатам в силу умозрительности предлагаемых автором интерпретаций. Имеются данные о
том, что общие субъективные оценки более валидны и надежны, нежели оценки по отдельным деталям рисунка.
В СССР «Н. ч.» т. первоначально применялся в клинико-психологических исследованиях. Анализировались преимущественно формальные аспекты рисунков, напр, размер фигуры, ее расположение на листе бумаги, степень законченности рисунка и т. п. (Ю. С. Савенко, 1970). Полученные при обследовании пациента результаты соотносились с клинической картиной заболевания, обогащая и уточняя представление о больном. Начиная с 90-х годов сфера использования теста существенно расширяется, выполнено немало исследований в возрастной и педагогической психологии.
НАРУШЕНИЙ ПСИХИЧЕСКОЙ АДАПТАЦИИ ОПРОСНИК (НПА) —
опросник личностный, разработан А. И. Скорик и Л. С. Свердловым в 1993 г. Предназначен для предварительной диагностики адаптационных нарушений.
Методика носит скрининговый характер (см. Отсеивание). Исследование, проводимое при помощи НПА, позволяет получить общее представление о наличии или отсутствии проявлений психической дезадаптации, их основных особенностях. Требования, предъявляемые к такого рода ускоренной диагностике, обусловили небольшой объем опросника и простоту обработки первичных данных.
Опросник НПА состоит из 37 утверждений, касающихся личностных качеств и психологических особенностей испытуемого, состояния соматической сферы, представлений о психическом здоровье, восприятия некоторых обыденных жизненных проблем. Задания опросника требуют только утвердительных или отрицательных ответов («да»—«нет», «верно»— «неверно», «согласен»—«не согласен»). Ответ «не знаю» не допускается. Опрос-
ник может применяться при индивидуальном и групповом обследовании. Оценки первичные подсчитываются в соответствии с «ключом», раздельно по 6 шкалам опросника. Особенностью первичной обработки является то, что подсчитывается не просто число совпадений с ключом с оценкой 1 балл за каждое совпадение, а суммируются удельные веса каждого из совпавших с ключевым значением ответов (см. Внутренняя согласованность). Весовая величина каждого пункта рассчитывалась на основе определения факторной нагрузки (см. Факторный анализ) данного ответа в измеряемом шкалой признаке. Расчет сделан таким образом, что веса пунктов выражаются целыми числами от 1 до 9. Сырые оценки переводятся в стандартные Т-баллы (см. Оценки шкальные). Результаты представляются графически на специальном бланке в виде оценок профильных.
Шкалы опросника разработаны на основе результатов факторного анализа первичного статистического материала, полученного в соответствующих клинических группах испытуемых: I. (В) Описывает переживание общего физического и психического комфорта. В норме у адаптированных испытуемых оценка по данной шкале имеет тенденцию к повышению. 2. (Н) Шкала «ипохондрии» — отражает степень фиксации на соматическом неблагополучии. При нарушениях адаптации оценка по данной шкале повышается. 3. (М) Шкала «гипоманиакальности» — фиксирует ощущение комфорта с оттенком эйфории, «форсированного благополучия», беспечности. При нарушении адаптации оценка снижается. 4. (Р) Шкала описывает депрессивное состояние. Результат отрицательно коррелирует с данными по шкале М. В норме наблюдается низкая оценка. 5. (N) Шкала «невро-тизации» — описывает состояние эффективно-вегетативного дисбаланса, возника-
ющего при эмоциональном напряжении, «нервозность». При нарушениях адаптации оценка повышается. 6. (S) Шкала фиксирует нарушения в сфере социальных отношений. У дезадаптированных оценка повышается.
При интерпретации данных НПА основное значение имеет анализ «профиля». Наряду с этим авторы предлагают простые формальные критерии диагностики дезадаптации. Простейшим из них является критерий, основанный на высоте профиля. Дезадаптация имеет место в том случае, если оценки хотя бы двух шкал превышают значения 70 Т или опускаются ниже 30 Т либо одна из шкал превышает 80 Т или опускается ниже 20 Т. По данным авторов, вероятность необнаружения реально существующей дезадаптации составляет лишь 5%. Однако вероятность того, что достаточно адаптированные лица будут причислены к дезадаптированным, составляет 22,5%. Это делает данный критерий малопригодным, в частности при проведении массовых эпидемиологических исследований. Более сложным и точным (10% вероятности того, что адаптированные будут причислены к дезадаптированным) является критерий, учитывающий дифференцированный результат по «шкалам благополучия» (В, М) и «шкалам неблагополучия» (Н, D, N, S). Дезадаптация диагностируется в тех случаях, когда В + М составляют 79 Т или когда сумма Н, D, N и S превышает 255 Т. Сравнительные исследования на материале контрастных групп показали высокую корреляцию комплексного критерия дезадаптации с верифицированным диагнозом (г = 0,85, Р < 0,001).
Надежность ретестовая НПА (при интервале ретеста I сутки) по различным шкалам колеблется в интервале rt - 0,74-0,90. Имеются сведения о валидности текущей, которая изучалась путем сопоставления данных контрастных групп
(группы психически здоровых адекватно адаптированных, психически здоровых с нарушениями адаптации и больных с не-врозоподобными состояниями). Сведения о надежности и валидности опросника НПА дают основание предполагать эффективность методики в индивидуальном и массовом скрининге состояний психической дезадаптации.
НЕСУЩЕСТВУЮЩЕЕ ЖИВОТНОЕ — проективная методика исследования личности; предложена М. 3. Дру-каревич.
Испытуемому предлагают придумать и нарисовать несуществующее животное, а также дать ему ранее не существовавшее имя. Из имеющейся литературы видно, что процедура обследования не стандартизована (используются разных размеров листы бумаги для рисования, в одних случаях рисунок выполняется цветными карандашами, в других — одним цветом и т. д.). Общепринятой системы оценки рисунка не существует. Теоретические посылки, положенные в основу создания методики, совпадают с таковыми у прочих проективных методик. Как и многие другие рисуночные тесты, Н. ж. направлен на _ диагностику личностных особенностей, иногда ее творческих потенций.
Показана удовлетворительная валид-ность конвергентная методики путем установления связи между результатами, полученными с ее помощью, и данными других личностных методик на материале обследования пациентов психиатрической клиники и лиц, проходящих профотбор в штат МВД (П. В.Яньшин, 1988, 1990). Валидность также подтверждена при дифференциации больных неврозами и здоровых (Т. И. Краско, 1995). Н. ж. — одна из наиболее популярных рисуночных методик и широко используется психологами СНГ при обследовании детей и взрослых, больных и здоровых чаще все-
го в качестве ориентирующей методики, т. е. такой, данные которой позволяют выдвинуть некоторые гипотезы об особенностях личности.
НОРМАЛЬНОЕ РАСПРЕДЕЛЕ-
НИЕ — вид распределения переменных. Н. р. наблюдается при изменении признака (переменной) под влиянием множества относительно независимых факторов. График уравнения Н. р. представляет собой симметричную унимодальную колоко-лообразную кривую, осью симметрии которой является вертикаль (ордината), проведенная через точку 0 (рис. 46).
Рис. 46. Процентное распределение случаев под нормальной кривой
Кривая Н. р. была построена для простого аппроксимативного решения задачи вероятности частот событий. Нормальная кривая описывается формулой де Муавра
где U — высота кривой над каждым заданным значением х(, х —среднее арифметическое xit а — среднеквадратическое отклонение от х.
Теоретически существует бесконечное множество нормальных кривых с конкретными значениями М и а. При
стандартизации тестовых оценок и в некоторых других случаях используется Н. р. со следующими характеристиками: М - 0; с = 1; площадь под нормальной кривой равна единице. Такое распределение носит название стандартного (единичного) Н. р. Для любого Н. р. в пределах значений х(М + о лежит около 68%, в пределах М ± 2ст — 95%, М ± За — 99,7% площади под кривой, Частоты случаев, укладывающихся в интервалы, ограниченные значениями от М ± стдоМ ± а, составляют 68,26%; 95,44%; 99,72%; 99,98 % соответственно (рис. 46). Высота кривой (U) над значением М приблизительно равна 0,3989. Асимметрия стандартной, как и любой другой нормальной, кривой равна нулю, эксцесс {Q) — трем (см. Оценка типа распределения). Распределение показателей, получаемых в эмпирических психологических и психодиагностических исследованиях при большом числе наблюдений, как правило, приближается к Н. р.
На практике важную роль имеет вычисление площади слева от любой точки на оси абсцисс, ограниченной участком нормальной кривой и ординатой этой точки. Так как площадь стандартного Н. р. равна единице, то доля этой площади отражает частоту случаев с хг меньшими, чем данное значение на оси X. Решение уравнения де Муавра для любого значения х неудобно, поэтому для определения площади слева от данного значения в различных Н. р. (по оси z) имеются специальные таблицы (см. табл. 1 Приложения III).
Важнейшим качеством Н. р. является то, что для семейства нормальных кривых характерны одинаковые доли площадей, лежащих под участками, ограниченными равными значениями о. При этом любую нормальную кривую можно свести к единичной и таким образом ответить на вопрос о площади между выбранными точка-
Площадь слева от г для этого значения составит 0,1020 (10,2%). Следовательно, число лиц, имеющих оценку ниже 8,3, составляет 89,8%, а число лиц с оценкой в интервале 8,3-10,4 составляет 97,5-89,8 = 7,7%.
Число случаев в пределах стандартного отклонения можно легко определить без расчетов. Так, в интервале оценок, соответствующих -2с и -а, находится 13,6% обследованных (см. рис. 46).
Н. р. наиболее часто применяют для статистического описания совокупности эмпирических данных, оценки совокупности генеральной по выборке, для стандартного нормирования тестовых баллов и перевода их в оценки шкальные (см. Стандартизация). На свойствах Н. р. основаны статистические критерии проверки гипотез (г-критерий, критерий X2, /^-критерий Фишера, ^-критерий Стьюден-таидр.).
,г-Критерий широко применяется для проверки коэффициентов -корреляции:
где а — допустимый уровень значимости (а * 0,05), V = 1 - 2 • 0,05: 2 * 0,45. По статистическим таблицам определяется, что ординате U = 0,45 соответствует
2кр = 0,65. В нашем примере г > гкр вычисленный коэффициент корреляции значим на уровне а < 0,05 и лишь менее чем в 5% случаев равен нулю.
НОРМАТИВНОЕ ОЦЕНИВАНИЕ —
подход к оценке-и интерпретации измеряемых тестом показателей, отражающих особенности личности или поведения, путем сравнения индивидуальных результатов со статистическими значениями нормативной выборки.
Н. о. более распространено по сравнению с альтернативным принципом ип-сативного оценивания. Здесь наиболее полно проявляется измерительный, квантифицирующий, характер психометрических техник. Существенным достоинством Н. о. является возможность строгого ранжирования испытуемых по результатам относительно выборочных данных, использования метрических шкал интервалов (см. Шкалы измерительные), относительная доступность интерпретации оценок пользователям психодиагностической информации (см. также Нормы тестовые, Стандартизация, Оценки шкальные).
К недостаткам Н. о. относится эмпиричность рассчитываемых показателей, определенная условность перенесения выборочных данных на индивидуальное обследование. В качестве подхода, позволяющего минимизировать недостатки Н. о., при сохранении его основных положительных сторон можно указать на Раша шкалы, с помощью которых результат испытуемого оценивается на основе «задание—ответ» зависимостей. Следует, однако, отметить, что Раша модель психологического тестирования в принципе также должна быть отнесена к Н. о., поскольку для расчета вероятности решения того или иного задания используются данные специальных выборок испытуемых.
НОРМЫ ТЕСТОВЫЕ — количественные и (или) качественные критерии оценки результатов теста, позволяющие определить уровень достижений или степень выраженности психологических свойств, которые являются объектами измерения. В качестве таких критериев выступают статистические показатели выборки стандартизации, а также различные признаки-симптомы, свидетельствующие о том или ином уровне выраженности диагностируемых качеств.
В психологической диагностике наиболее распространены количественные Н. т., полученные на основании определения средних величин х и дисперсии в выборке стандартизации (см. Меры центральной тенденции, Меры изменчивости). Рассчитанные для нормативной выборки х среднее и дисперсия являются основой для разработки оценок шкальных теста. Количественные Н. т., упорядоченные в шкалы на основе процедур z-преоб-разования (см. Нормальное распределение, Стандартизация), содержатся в специальных таблицах, прилагаемых к руководствам по проведению тестирования. В этом виде Н. т. позволяют установить относительное место каждого конкретного результата по сравнению с выборочными данными, выраженными в долях дисперсии. Такие количественные Н. т. наиболее типичны для тестов интеллекта, опросников личностных и др. В проективных техниках, в силу известных затруднений, возникающих при формализации оценок первичных, вследствие сложности учитываемых диагностических показателей, количественные Н. т. не столь распространены.
Своеобразной переходной формой между количественными и качественными Н. т. являются критерии оценки наиболее ранних тестов интеллекта. Так, в Вине—Симона умственного развития шкале Н. т. представлены в виде норма-
тигшых заданий, на выполнении или невыполнении которых базируется установление умственного возраста и интеллекта коэффициента.
В виде качественных Н. т. могут выступить стандартизированные наборы квалификационных требований к испытуемому, аналогичные шкалам умственного развития, либо специально разработанные для данного теста комплексы диагностических признаков. Примером последних может служить условная шкала определения уровня алкоголизации:
0 уровень — полное воздержание от алкоголя; отсутствие опыта приема.
1 уровень — эпизодический прием; неприятные воспоминания о приеме алкоголя.
2 уровень — систематический прием; удовольствие от употребления; включение небольших доз в общий рацион питания.
3 уровень — эпизоды передозировки; возникновение похмелья.
4 уровень — возникновение психической зависимости; случаи употребления алкоголя с утра для поднятия настроения.
5 уровень — частые случаи похмелья; активный поиск алкоголя; формирование физической зависимости.
6 уровень — эпизодические запои; признаки социальной (главным образом семейной и трудовой) дезадаптации; изменения в эмоциональной и мотива-ционной сферах личности.
Дата добавления: 2015-07-10; просмотров: 115 | Нарушение авторских прав