Прогноз и распознавание образов

Читайте также:

Кардинальное значение для психодиагностики имеет проблема прогнозирования. Существует точка зрения, разделяющая психодиагностику и так называемую «психопрогностику» (Забродин Ю. М., 1984). Это указывает на самостоятельное значение проблем прогнозирования.

В действительности, конечно, ' всякая психодиагностика служит фактически прогнозированию — на.больших или меньших отрезках времени. То, что называется диагностикой текущего состояния объекта,, имеет следующий смысл. В технике подвергают испытаниям какой-то агрегат — не реальным, но стендовым условным. Полученные результаты приписывают текущему состоянию объекта, имея в виду, что «выключенный» агрегат до его эксплуатации в реальных условиях уже не будет изменяться сколь-нибудь существенно в своем состоянии. При этом подразумевается, что именно работа включенного агрегата является основным фактором изменения его¹ состояния в частности выхода из допустимого режима.

В психологии, конечно же, дело обстоит по-другому. И перенос подразумеваемых, имплицитных представлений из технической диагностики в психодиагностику неправомерен, как, впрочем, неправомерен такой перенос уже и по отношению к медико-биологической диагностике человеческого организма. Организм человека, его психика — это не агрегат, который произвольно можно выключить на период от

95-

тестирования до реального испытания. Все это время человек продолжает жить, активно взаимодействовать со средой. Даже в изоляции, даже во сне мозг человека проделывает большую работу, переводя полученную информацию из одних отделов памяти в другие (Касаткин В. Н., 1967). Все это означает, что принцип статистической экстраполяции результатов психодиагностического измерения в будущее нельзя считать оправданным без проведения специальных проверок.

Когда психолог регистрирует по результатам тестирования у не
которого индивида А показатель Х_а, а у некоторого индивида В пока
затель Хь, так что Х_а>Хь, то из этого вовсе не следует автоматически,
что соотношение Х_а~>Хь сохранится в течение следующей недели, ме
сяца, года. Понятно, что для принятия стратегии экстраполяционного
статистического прогноза требуется предварительно произвести эмпири
ческое измерение надежности — устойчивости (ретестовой надежности)
на заданном промежутке времени. ^

При этом важна не только длина отрезка времени между двумя измерениями, но и его заполненность теми или иными значимыми для индивида событиями. Приведем простой пример. Организовано психологическое обследование абитуриентов вуза. Психологи пытаются измерить уровень интереса поступающих к избранной специальности (области науки или техники). Но применяются «лобовые» опросниковые методики, не защищенные от преднамеренной фальсификации (абитуриенты вполне естественно сознательно или даже бессознательно будут искажать результаты в сторону повышенного интереса — чтобы произвести благоприятное впечатление). Фальсификация здесь только один из возможных источников некорректности статистического прогноза. Для эмпирического измерения силы этого артефакта не обязательно проводить повторное измерение через несколько лет. Имеет смысл провести повторное обследование по той же методике всех студентов, сразу же после их зачисления на первый курс. Если возникнет слишком много перестановок типа Х_а<Х_ь, то ранговая корреляция «тест — ретеет» окажется слишком слабой, и это доказывает неправомерность использования '«лобовой» методики для статического прогноза. Другой возможный источник нестабильности ранговой шкалы (порядковой шкалы теста) обусловлен в данном примере зависимостью уровня интереса к предметной области от уровня знаний о предмете. В ходе обучения в вузе студенты приобретают более детальные знания о предмете, о своей успешности в освоении специальности, и от этого-уровень интереса может существенно изменяться. Конечно, этот фактор в отличие от фактора фальсификации действует на более длительных промежутках времени. И здесь опять же требуются специальные измерения ретестовой устойчивости для применения статического прогноза.

Приведенный выше пример показывает, что в некоторых случаях проблемы психопрогностики целесообразно начинать решать без всякого привлечения внешней по отношению к тесту критериальной информации, т. е. средствами проверки надежности, но не средствами проверки валидности. Если уже таким способом будет получен отрицательный результат, то заведомо будет получен и для измерения валидности статического прогноза (вспомним основной принцип валидность методики не превышает ее надежности).

Но надежность лишь необходимое, но, естественно, недостаточное условие прогностической валидности. Можно убедиться в высокой устойчивости тестового показателя на длительных промежутках времени, но из этого не следует, что будут получены значимые линейные -корреляции тестового показателя с требуемым критерием валидности -

эффективности — корреляции, оправдывающие статический прогноз.

Как правило, на основе диагностики принимаются решения, которые соотносятся между собой как события яга шкале наименований или на шкале порядка. Как учитываются сегодня при приеме в вуз показатели школьной успеваемости абитуриентов? Существуют три варианта, три градации, соотносимые друг с другом по шкале порядка: выпускникам школы — медалистам предоставляются льготные условия (при успехе на первом экзамене от остальных вступительных экзаменов медалист.освобождается), лица с удовлетворительным средним баллом допускаются к конкурсным вступительным экзаменам и проходят все экзамены, наконец, лица с неудовлетворительным средним баллом могут вообще не допускаться к вступительным экзаменам. На этом примере видно, что средний балл аттестата используется как некоторый показатель своего рода «теста», в соответствии с которым абитуриенты разделяются на три категории, по отношению к которым неявно применяется «порядковый» прогноз: предполагается, что медалисты будут успешнее обычных выпускников школ, а обычные выпускники — успешнее тех, кто учился в школе очень слабо.

«Порядковый» прогноз сохраняет свою эффективность не только в статических условиях, но и в условиях таких динамических изменений объектов прогнозирования, при которых порядковая структура оказывается неизменной. Предположим, что в ходе обучения в вузе все студенты по мере более глубокого ознакомления с предметом испытывают нарастающий интерес к своей специальности, но если порядковая структура сохраняется (Х_а продолжает превышать Хь, несмотря на то, что Хь приближается к Х_а), то «порядковый» прогноз все равно остается корректным.

Линейные и порядковые прогностические стратегии на практике.применяются не к одномерным, но к многомерным данным. Среди математических моделей прогнозирования до сих пор наибольшей популярностью пользуются относительно простые (а иногда и неоправданно упрощенные) регрессионные модели.

При этом для многомерного случая задача психометриста сводится к построению уравнения множественной регрессии:

где У — прогнозируемая переменная (критерий прогностической валидности);

Xi — значение i-того тестового показателя из рассматриваемой батареи тестовых показателей;

Pi — значение весового коэффициента, указывающего, на сколько (в единицах стандартных отклонений) изменяется прогнозируемая переменная при изменении тестового показателя Xi.

Для построения указанного уравнения требуется произвести «упреждающее» измерение тестовых показателей по отношению к критериальному показателю У, измерение которого производится по истечении некоторого отрезка времени ДГ, называемого в прогнозировании периодом упреждения.

Общая эффективность прогноза на основе регрессионного уравнения оценивается с помощью подсчета коэффициента множественной корреляции R² (Суходольский Г. В., 1972) и последующей оценки его значимости по критерию Фишера:

(3.5.2)

..--.,:. ' ' ' \, '. ^:. '

где.F_e —-эмпирическое значение статистики Фишера со степеням» свободы V\=k и Vz—N — k;

N — количество индивидов;

k — количество тестовых показателей.

Не следует забывать, что основой применения этой модели прогноза»
является экстраполяция.— предположение о том, что на новом отрез
ке времени AT' будут действовать те же тенденции связи переменных;,
что и на отрезке ДГ, на котором прежде измерялись весовые коэффи
циенты pj. Не следует также забывать, что корректность прогноза
обусловлена величиной периода упреждения: для больших (или Мень
ших) величин AT использование уравнения (3.5.1) может оказаться
некорректным. «

Прогностические возможности указанного метода ограничены одно_гкратностью измерения тестовых показателей Х\, Х%,..., Х*. В силу
однократности измерения этот метод оказывается эффективным опять-
таки только по отношению к самым универсальным и статическим по—
казателям (таким, например, как интегральные свойства темперамента
или нервной системы), обеспечивающим очень грубый, вероятностный,,
приближенный прогноз.

В некоторых случаях эффективность этого метода может существенно повыситься, если использовать хотя бы двукратное (с небольшим интервалом в две-три недели) измерение системы показателей Х\, Х%,..., Xk- Уже таким способом можно, например, учесть вклад фактора¹ «усвоение знаний» в прогнозирование мотивационной вовлеченности (уровня интереса) учащегося вуза в свою специальность. Повторное измерение (например, через месяц после начала обучения & "вузе) позволяет выявить, в каком направлении действует фактор «усвоение знаний» в своем влиянии на уровень интереса данного учащегося: может оказаться, что в результате разнонаправленного действия этого фактора немало пар учащихся уже через месяц поменяются местами в ранговом ряду по уровню интереса (Х_а<Хь). В.этом-случае в уравнение (3.5.1) целесообразно ввести не статический показатель Х[, но простейший динамический показатель AXj = xV—X'j. Кроме того, не исключена, возможность одновременного использования⁵в уравнении (3.5.1) и статических.показателей Xi. и динамических AXt, тогда разработанная модель прогноза будет учитывать как достигнутый уровень (экстраполировать статику), так и намечающиеся тенденции (экстраполировать тенденции).

Приведем еще один содержательный пример. Многочисленные эмпирические исследования по прогнозированию супружеской совместимости (Обозов Н. Н., 1979) показали неудовлетворительно низкий уровень надежности прогноза на основе таких показателей, как однократно измеренный уровень сходства (темперамента, мотивов, интересов, ценностных ориентации) или взаимодополнительности психических, свойств будущих супругой. Но эту надежность можно существенно повысить, если ввести в уравнение (3.5.1) показатели типа АХ{. 'В данном случае содержательно-психологический смысл этих показателе» будет заключаться в следующем: они указывают на то, в каком направлении действует на уровень сходства (совместимости) опыт взаимодействия будущих супругов. Потенциально несовместимые супруг» в ходе взаимодействия (за период помолвки), как правило, дивергируют в своих показателях (например, имеющиеся незначительные акцентуации характера взаимно усиливаются). Наоборот, потенциально-совместимые супруги могут очень быстро конвергировать: оказывается достаточным проведение одного-двух обсуждений с участием психолога»

по спорным вопросам, чтобы сблизиться в представлениях о желаемом семейном укладе и образе жизни.

Более сложные математические методы прогнозирования, например, учитывающие циклическую динамику объектов, пока еще редко используются в психодиагностике, так как требуют частых многократных измерений системы тестовых показателей, что оказывается невозможным по чисто практическим причинам. Тем не менее уже сегодня можно твердо констатировать недостаточность линейных моделей прогнозирования. Для ознакомления с рядом других подходов к прогнозированию мы. рекомендовали бы психологам обратиться к руководству «Рабочая книга по прогнозированию» (М.,. 1982).

Остановимся здесь более специально на подходе, который ныне представляет собой реальную альтернативу ограниченным линейным статистическим моделям и позволяет строить эффективный прогноз для более сложных зависимостей между прогнозируемыми (зависимыми) и прогнозирующими (независимыми) переменными. Этот подход, по традиции, принято называть «распознаванием образов», так как разработка его математического аппарата была во многом стимулирована инженерными задачами конструирования искусственных систем «зрения», «слуха», других органов чувств (Распознавание образов. М., 1970).

В психодиагностике роль «элементарных сенсорных данных» выпол-
няют первичные тестовые показатели Х\, Х% Хь, а роль «образа»

(выходного сигнала системы) выполняет соответствующая диагности-
ческая категория. Таким образом, по существу, «распознавание обра-
зов» и есть диагностика в широком смысле..,

Поясним специфику подхода на простейшем схематическом примере. Пусть Ру — вероятность такого типового критерия оценки студентов, как «успеваемость», Xi — уровень интереса к специальности,.выявленный у абитуриента, Х₂ — уровень знаний о специальности. Возможна -такая, нелинейная форма зависимости Р_у от параметров Xi и. -Х₂ (рис. 16).

Здесь (на рис. 16) точки Х\=0 и

Jf₂ = 0— медианные значения соответ- • •

р»0,5

Р>0,5

Рис. 16. Иллюстрация нелинейной связи вероятности критериального события Р и диагностических параметров Xi и Х₃

ствующих тестовых показателей.,В
данном упрощенном примере в стату
се «образа» фигурирует каждый из че
тырех квадрантов диагностического
пространства. Для. предсказания Р_у мы не можем построить линейной ком
бинации Х\ и' Х₂, какие бы коэффици
енты Pi и Рз мы не взяли. Для пред
сказания Ру мы должны зафиксиро
вать попадание индивида в заданную
'область пространства параметров.
-«Образ», или диагностическая катего
рия, и есть на геометрическом дзыке
•определенная область в пространстве
параметров. /

С точки зрения «распознавания образов» предварительная задача диагностики (предваряющая практическую диагностику) — определить границы диагностических категорий — областей в пространстве

" Этот подход включает в себя' линейные модели как частный случай.

параметров, которым эмпирически корректно.могут быть приписаны некоторые пороговые (качественно специфичные) значения прогнозируемого критериального показателя. Это задача построения «разделяющего правила» (или «решающего правила»). Точность такого разделения и предопределяет прогностическую валидность методики на данной совокупности испытуемых в данной диагностической ситуации.

Репрезентативность выборки при этом определяется степенью изменения точности разделения при увеличении совокупности обследованных. Влияние того или иного параметра на точность разделения определяет «вес», с которым входит данный параметр в задачу диагностики.

Построение • формальной процедуры разделения может производиться по-разному. В простейшем случае — это сравнение тестового показателя с некоторым порогом. В более сложных случаях применяются методы дискриминантного анализа, позволяющего описывать «разделяющие правила» (границы диагностических областей в пространстве параметров) в виде сложных функций сразу от нескольких параметров.

Применение определенного метода для решения задачи построения системы диагностических категорий определяется несколькими факторами: во-первых, это соответствие допущений, положенных в основу алгоритма, содержательным представлениям о психологической типологии индивидов в рамках рассматриваемой системы психодиагностических параметров, во-вторых, это степень полноты имеющейся информации для эффективной «остановки» алгоритма, обеспечивающей оптимальное решение задачи за приемлемое время.

Под полнотой информации здесь, в частности, имеется в виду на-
личие достаточно многочисленных групп индивидов, четко и однозначно-
классифицированных по заданной системе критериев. В этом случае
построение решающего правила сводится к применению какого-либо-
алгоритма автоматической классификации, приспособленного к работе
с «учителем» с заданными классами. Если же критериальные классы
представлены неполно — всего несколькими представителями, для ко
торых при этом не всегда известны все значения необходимых пара-
метров, то возникает ситуация, требующая применения так называе-
мых «эвристических алгоритмов» (более подробно о применяемых алго-
ритмах классификации см. кн.: Типология и классификация в социоло-
гических исследованиях. М., 1982). /

Остановимся здесь на одном из методов распознавания, получившим опыт применения в психодиагностике — на семействе алгоритмов вычисления оценок (АВО), предложенных и разрабатываемых Ю. И. Журавлевым и его учениками (1978).

Содержательно.основную задачу распознавания образов можно сформулировать \как задачу отнесения объекта S к одному или нескольким классам К\, /Сг,..., Kt на основе информации о классах I(Ki), I (Kz),..., I (Kt), информации об объекте 1(8) и предположения о близости объекта к классу. Другими словами, задачу распознавания можно сформулировать как задачу определения того, обладает ли объект определенными свойствами.

В основе АВО (или алгоритмов голосования) лежит принцип частичной прецедентности: близость объекта к классу тем больше, чем больше частей в его описании «похожи» на соответствующие части в описаниях объектов, чья_v принадлежность классу известна. Например, в одном из вариантрв АВО (Зеличенко А. И., 1982) функция близости объекта S к классу К определяется как:

100... '

(3.5.3)

1, если

О—в противном случае,

где S* — t'-тый объект, принадлежность которого к классу К уже известна;

a/(S) — /-тый элемент (параметр) в описании объекта;

pi —его вес;

е,- — /-тый порог.

После того как вычислены F(SiKi),...,F(Si, Ki) на основании некоторого решающего правила (зависящего от вектора параметров В), принимается решение о принадлежности объекта к одному или нескольким классам Ki,..., Ki. В задачах психодиагностики S — это испытуемый.

Таким образом, каждый вариант АВО определяется набором значений параметров. В нашем случае — это векторы p=(pi,...,p_m),

e=(ei....... е_т). Если информация об объекте 5 представлена в виде

J(S) = (fli,..., a_m), то элемент вектора опорных множеств o>/(S)=a/, а е/ — /-тый порог.

В качестве примера решающего правила можно привести следующее (линейное пороговое решающее правило):

объект 5 принадлежит классу Kt, если

, K_t)>C\,

(3.5.4)

объект S не принадлежит классу Kt, если

(3.5.5)

в остальных случаях — отказ от распознавания принадлежности объекта 5 классу Kt.

В работе алгоритмов распознавания вообще и АВО в частности можно выделить два этапа: обучение и собственно распознавание. На этапе обучения, как уже говорилось, происходит настройка алгоритма, т. е. выбор таких его параметров, которые обеспечивают оптимальное в некотором смысле распознавание объектов обучающей выборки (объектов', принадлежность которых классам Ki,..., Kt известна). На этапе собственно распознавания происходит отнесение к классам Ki,...,Kt тех объектов, принадлежность которых «классам априорно неизвестна.

Точность распознавания на этапе обучения измеряется полнотой
и адекватностью распознавания эталонных объектов. Наряду с поня-
тием «точность» '(абсолютная отделимость) иногда удобно использовать
понятие относительной отделимости объектов обучающей выборки, при
надлежащих различным классам. В случае, когда распознавание ве-
дется для двух классов (например, в профориентации — для диффе-
ренциального прогноза успешности оптанта в одной из двух профес-
сиональных областей), относительную отделимость можно определить
как

(3.5.6)

X — Xmin 100-Xmin '

где х — точность при обучении (выраженная в процентах), минимальная возможная точность обучения (совпадает с долей объектов в наибольшем классе от общего объема обучающей выборки). На этапе собственно распознавания точность характеризует главным образом репрезентативность обучающей выборки (выборки валидизации). Чем выше репрезентативность, тем больше совпадают показатели точности на этапах обучения и собственно распознавания.

Использование АВО кроме решения задачи распознавания позволяет получить еще следующую информацию.

1. Информационные веса отдельных элементов (параметров) опи-
сания объектов. Эти веса измеряются через изменение точности рас
познавания при исключении соответствующих параметров из описания
эталонных объектов:

г \ /у у 7~" \\ /о е *7\

где х — точность распознавания при Р/ = 1; х(я/) — точность распоз-
навания при Р/ = 0, а а — нормирующий множитель. Информационные
веса интерпретируются как мера прогностической важности пара-
метров..

2. Оптимальные значения порогов в, т. е. значение б, обеспечива-
ющие наивысшую точность распознавания. Эти.значения порогов в
нашем случае можно интерпретировать как чувствительность методики,
е/ — своего рода дифференциальный порог на шкале тестового пока-
зателя а/, определяющий переход индивида из одной диагностической
категории в другую. Пусть на этапе разработки теста (тестовой бата-
реи) была обследована группа из К человек, про которых известно, что
К\ из них относится к одному классу, a Kz — к другому, K=Ki + Kz.
Выбрав случайным образом из этой группы М(М</С) многомерных
описаний, проводим на них процедуру обучения алгоритма. Точность
обучения характеризует валидность теста* После этого применяем про-
цедуру собственно распознавания (по выработанному решающему пра-
вилу) для остальных К — М описаний. В результате этой процедуры мы
определяем принадлежность респондентов (испытуемых) к нашим клас-
сам. Сравнивая эти результаты с априорными (эталонными) данными
о принадлежности испытуемых классам, мы определяем точность са-
мого распознавания. Если эта точность близка к точности обучения, то
наша пилотажная выборка объемом М может быть признана репре-
зентативной для обучения. Далее можно переходить к задаче опре-
деления информационных весов.

Для эффективного. использования алгоритмов распознавания по отношению к многомерным тестовым системам (при /f>3), как правило, требуется использование ЭВМ. Большинство алгоритмов принципиально сконструированы в расчете на вычислительные возможности ЭВМ с ее «терпеливой готовностью» повторять одни и те же циклы вычислений (итерации) сотни и тысячи раз.

При решении задач небольших размерностей (по количеству параметров) иногда психолог может быстрее найти решающее правило, используя Собственные способности зрительной системы (очень мощные) к визуально-геометрической группировке объектов. В простран-

102.1

стве параметров диагностические классы выглядят, как «сгущения», некие «облака» из точек, изображающих испытуемых. В этом случае при наличии априорной информации о принадлежности индивидов классам удобно изображать точки из различных классов разными цветами (хуже — разными фигурками: квадратиками, кружками, треугольниками). В этом случае «решающее правило» легко «увидеть» как некую воображаемую линию (прямую или кривую), разделяющую точки разного цвета (см. рис. 17). Точность диагностики в данном случае можно оценить по числу точек, попавших при данном решающем правиле в «чужую» половину пространства параметров. Точность правила, изображенного на рис. 17, равна:

10 X 12 — 2ХЗ 13 X Их 12 х 15

0,63

ф:

\ • д °Ч -«>. -_ _ _ _ ^х^	д л " А ⁰ Д о
о о ""*---?- В о^Й	" ~~5"---.* ^х> о \ д о д ° \ о \

Здесь в четыре клеточной таблице сопряженности по строкам задано попадание объекта в один из априорных классов А (треугольники на рис. 17) или В (кружочки на рис. 17), а по столбцам — попадение объектов в один из апостериорных классов, образованных применением решающего правила, — К (слева от критериальной линии) или В (справа от критериальной линии). Как указано выше, для статистичес-

Рис. 17. Геометрическая схема, иллюстрирующая разделение двух классов объектов (изображены кружками и треугольниками) в пространстве двух параметров Х\ и Хг

кой оценки точности может быть использован фи-коэффициент, связанный по известной формуле с критерием хи-квадрат.

Дата добавления: 2015-10-24; просмотров: 42 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Y •*• ^O.Z.IOJ	\|	КОМПЬЮТЕРИЗОВАННАЯ ПСИХОМЕТРИКА

mybiblioteka.su - 2015-2025 год. (0.017 сек.)