Комплексное научение

Читайте также:

Вопрос 9. Дифференцированное корректиро-вание норм расхода автомобильного топлива и ее недостатки. Комплексное корректирование норм расхода автомобильного топлива.
Вопрос 9. Дифференцированное корректирование норм расхода автомобильного топлива и ее недостатки. Комплексное корректирование норм расхода автомобильного топлива.
Детство - научение эмоциям
Комплексное лечение заболеваний пародонта
Комплексное применение средств восстановления работоспособности после физических нагрузок
Научение

Третий тип теории научения иллюстрирован такими терминами, как предпочтение, выбирание, различение, и согласование. Может быть сделано усилие определить их только в терминах поведения, но в традиционной практике они относятся к процессам в другой измерительной системе. Ответная реакция на один из двух имеющихся стимулов может быть названа выбором, но проще сказать, что она является результатом выбора, имея в виду под последним теоретическую доповеденчекую активность. Более напряженнее ментальные процессы являются лучшим примером теорий данного вида; неврологические параллели не были хорошо выработаны. Обращение к теории подтверждается тем фактом, что выбирание (как и различение, согласование, и т.д.) не является отдельной частью поведения. Это не ответная реакция или акт со специфичной топографией. Этот термин характеризует больший сегмент поведение в отношении к другим переменным или событиям. Можем ли мы сформулировать и изучить поведение, к которому данные термины будут применены, не прибегая к теориям, которые в общем дополняют их?

Различение является относительно простым случаем. Предположим, что мы выясняем, что возможность распространения данного вида ответной реакции не значительно нарушается при изменении одного из двух стимулов на другой. Мы затем делаем подкрепление ответной реакции зависящим от присутствия одного из них. Хорошо обоснованный результат заключается в том, что возможность ответной реакции остается высокой при этом стимуле и достигает очень низкой отметки при другом. Мы говорим, что организм теперь различает стимулы. Но различение само по себе не является действием, или обязательно даже уникальным процессом. Проблемы в сфере различения могут быть обозначены другими терминами. Насколько индукция имеет место между стимулами различной силы или классов? Каковы наименьшие различия в стимулах, которые (вызывают) различие в управлении? И так далее. Подобные вопросы не предполагают теоретической активности в других измерительных системах.

Достаточно более детально должно быть рассмотрено поведение в ситуации выбора одного из двух одновременно действующих стимулов. Оно было изучено у голубя путем измерения ответных реакций на два стимула, отличающихся [с.211] по расположению (слева или справа) или по каким-либо свойствам, как цвет, распределенным случайным образом по отношению к расположению. Время от времени подкрепляя ответную реакцию то на один стимул, то на другой без выделения какого-либо одного из них, мы добились равного соотношения ответных реакций на два стимула. Поведение превращается в простое чередование двух стимулов. Такой результат подтверждает правило о том, что тенденция к ответной реакции, в конечном счете, соответствует вероятности подкрепления. Допустим, существует устройство, в котором один или другой рычаг время от времени соединяется внешним счетчиком с кормушкой, тогда, после нажатия правого рычага вероятность подкрепления при нажатии левого рычага возрастает по сравнению с правым до истечения определенного промежутка времени, в течение которого счетчик может перекрыть соединение с левым рычагом. Но поведение птицы не соответствует данной вероятности, так как не имеет отношения к математике. Специфическим результатом такой случайности подкрепления является то, что переключение-на-другой-рычаг-и-нажатие подкрепляется чаще, чем нажатие-того-же-рычага-второй-раз. Мы больше не занимаемся просто двумя ответными реакциями. Чтобы анализировать “выбор” мы должны рассматривать отдельную конечную ответную реакцию, нажатие, без внимания к расположению или цвету рычага, а также ответные реакции переключения от одного рычага или цвета к другому.

С данным рассуждением совместимы количественные результаты. Если мы периодически подкрепляем ответные реакции только на правый рычаг, коэффициент реагирования на правый будет возрастать, в то время как на левый падать. Ответная реакция переключения-с-правого-на-левый никогда не подкрепляется, в то время как ответная реакция переключения-с-левого-на-правый подкрепляется время от времени. Когда птица нажимает на правый, не появляется особой тенденции переключиться; когда она нажимает на левый, появляется сильная тенденция переключиться. Намного больше ответных реакций сопровождаются выбором правого рычага. Необходимость рассмотрения поведения переключения ясно проявляется, если мы теперь изменим эти условия на противоположные и будем подкреплять ответные реакции только на левый рычаг. Конечным результатом будет высокий коэффициент реагирования на левый рычаг и низкий коэффициент на правый. При повторном изменении условий на противоположные высокий коэффициент может быть сдвинут обратно на правый рычаг. На графике 11а группа из восьми кривых рассчитывалась в среднюю величину, чтобы проследить эти изменения в течение шести экспериментальных периодов по 45 минут каждый. Начиная со второго дня на графике ответные реакции на правый рычаг (R^R) падают до угасания, в то время как ответные реакции на левый рычаг (R^L) возрастают посредством периодического подкрепления. Средний коэффициент показывает незначительное изменение [с.212] до тех пор, пока периодическое подкрепление продолжается по тому же расписанию. Средний коэффициент показывает независимость условия силы ответной реакции нажатия от расположения. Распределение ответных реакций между правым и левым зависит от изменения силы ответных реакций. Если бы имело место лишь угасание одной ответной реакции и сопутствующее переобуславливание другой, то кривая средней величины не оставалась бы почти горизонтальной, так как переобуславливание происходит намного быстрее, чем угасание.

Соотношение, с которым птица переключается с одного рычагана другой, зависит от расстояния между ними. Это расстояние выступает как жесткое основание для различия стимулов между двумя рычагами. Оно также устанавливает область действия ответной реакции переключения при изменении условий на противоположные с предполагаемой разницей в сенсорной обратной связи. Оно также ограничивает распространение подкрепления на ответные реакции, которые не должны подкрепляться, так как если рычаги находятся близко друг к другу, то ответная реакция, подкрепленная на одной стороне, может произойти вскоре после предшествующей ответной реакции на другой стороне. На графике 11 два рычага находились на расстоянии около одного инча (~2,540 см.) друг от друга. Они были, следовательно, довольно похожи в отношении расстояния на экспериментальный ящик. Переключение от одного к другому включало минимум сенсорной обратной связи, а подкрепление ответной реакции на один рычаг могло в скором времени следовать за ответной реакцией на другой. Когда рычаги разделены четырьмя инчами, изменение в силе намного более стремительно. График 12 показывает две кривые, записанные одновременно с отдельного голубя в течение одного экспериментального периода приблизительно в 40 минут. Высокий коэффициент на правый рычаг и низкий коэффициент на левый рычаг были предварительно закреплены. На графике ни одна ответная реакция на правый не была подкреплена, но на левый – подкреплялись каждую минуту, как проиллюстрировано вертикальными штрихами над кривой L. Наклонная R идет на убыль довольно плавно, в то время как L возрастает, также достаточно равномерно, до значения, сопоставимого с начальным значением R. Птица адаптировалась к изменяемым случайным условиям в пределах отдельного экспериментального периода. Средний коэффициент ответных реакций показан пунктирной линией, которая вновь демонстрирует отсутствие значительного изгиба.

То, что называют "предпочтение" входит в эту формулировку. В любой стадии процесса, показанного на рис. 12, предпочтение могло бы быть выражено в терминах относительных долей ответных реакций на эти два ключа. Это предпочтение, однако, не в ударе по ключу, а в изменении от одного ключа к другому. Вероятность, что птица ударит ключ не обращая внимание на его идентификационные свойства, она ведет себя независимо от предпочтительной ответной реакции замены одного ключа на другой. Несколько экспериментов обнаружили дополнительное явление. Предпочтение остается установленным, если в подкреплении отказывают. Примером этого является Рис. 13. Он показывает одновременное угасание кривых от двух ключей в течение семи ежедневных экспериментальных периодов по одному часу каждый. До угасания относительная сила ответных реакций изменяющихся к R и изменяющихся к L привела к "предпочтению" для R от приблизительно 3 до 1. Постоянство степени в течение процесса угасания были показаны в фигуре, путем увеличения L через подходящую константу и входы в точки как маленькие круги на R. Если бы угасание изменило предпочтение, то две кривые не могли бы быть добавлены таким способом.

Такие определения различения и выбора позволяют нам иметь дело с тем, что вообще расценивается как намного более сложный процесс - соответствие образцу. Предположим, что мы устанавливаем три полупрозрачных ключа, каждый из которых может быть освещен красным или зеленым светом. Средний ключ функционирует как образец, и мы окрашиваем его или красным или зеленым в случайном порядке. Мы красим стороны двусторонних ключей красным и зеленым цветом, также в случайном порядке. "Проблема" состоит в том, чтобы ударить боковой ключ, который соответствует в цвете среднему ключу.

В таком случае есть только четыре образца с тремя ключами, и возможно, что голубь мог научиться делать соответствующую ответную реакцию на каждый образец. Это не случается, по крайней мере, в пределах временного промежутка экспериментов до настоящего времени. Если мы просто представим ряд параметров настройки трех цветов и укрепим успешные ответные реакции, то голубь ударит сторону ключей без уважения к цвету или образцу и будет подкрепляться 50 процентов времени.

Это, в действительности, список подкрепления "неподвижного отношения", которое является адекватным поддержать высокую долю ответной реакции. Однако возможно заставить голубя соответствовать образцу, подкрепляя отличительные ответные реакции "нанесения удара по красному после того, как его стимулировали красным" и "нанесением удара по зеленому после того, как его стимулировали зеленым", гася другие две возможности. Трудность находится в подготовке надлежащего стимулирования во время ответной реакции.

Образец мог бы быть сделан заметным - например, при наличии типового цвета в общем освещении экспериментальной коробки. В таком случае [p. 214] голубь научился бы ударять красные ключи в красном свете и зеленые ключи в зеленом свете (принятие нейтрального освещения фона ключей). Но процедура, которая держится более близко к понятию соответствия, должна побудить голубя "смотреть на образец" посредством отдельного подкрепления.

Мы можем сделать это, предоставляя цвет на среднем ключе сначала, оставляя бесцветными ключи стороны. Ответная реакция на средний ключ тогда подкреплена (во вторую очередь) путем освещения ключей стороны. Голубь учится делать две ответных реакции в быстрой последовательности - к среднему ключу и затем к одному стороннему ключ. Ответная реакция на боковой ключ следует быстро на визуальное возбуждение от среднего ключа, который является необходимым условием для различения. Успешное соответствие было с готовностью установлено у всех десяти голубях, проверенных с этой техникой. Выбор противоположности также легко устанавливается. Отличительную ответную реакцию "нанесения удара красного после стимуляции красным" очевидно не легче установить чем "нанесение удара красного после стимуляции зеленым". Когда ответной реакцией являлось реагирование на ключ того же самого цвета, то генерализация предполагала и тот вариант, что птица выберет новый цвет. Это - расширение понятия соответствия, которое еще не было изучено с этим методом.

Даже когда соответствие поведению было хорошо установлено, птица не будет отвечать правильно, если все три ключа будут теперь представлены в то же самое время. Птица не обладает столь сильным поведением, чтобы наблюдать за образцом. Экспериментатор должен сохранить отдельное подкрепление, чтобы держать такое поведение в силе. У обезьян, приматов, и человека окончательный успех в выборе очевидно достаточен, чтобы укрепить и поддержать поведение наблюдения за образцом.

Возможно, что это различие разновидностей является просто различием во временных отношениях, требуемых для подкрепления. В поведении соответствия выживает неизменный, когда во всем подкреплении отказывают. Промежуточный случай был установлен, в котором только периодически подкрепляется правильная ответная реакция выбора. В одном эксперименте один цвет появился на среднем ключе в течение одной минуты; он был тогда изменен или же не изменен, наугад, на другой цвет. Ответная реакция на этот ключ давала освещение на боковые ключи, один красный и один зеленый цвет, в случайном порядке. Ответ на боковой ключ отключал освещение у обоих боковых ключей, пока средний ключ не был снова нажат. Аппарат делал запись всех ответных реакций выбора на одном графе и всех несоответствий им на другом. Голуби, которые приобрели выборочное поведение под непрерывным подкреплением, успешно поддерживали такое поведение не чаще чем в среднем один раз в минуту. Они могут дать тысячи выборочных ответных реакций в час, получив подкрепление только лишь на шестьдесят из них. Это не обязательно разовьет поведение выбора у простой птицы, поскольку такая проблема может быть решена тремя способами. Птица получит множество подкреплений, если она даст ответную реакцию (1) только на один ключ или (2) только на один цвет, поскольку планирование эксперимента делает любую постоянную ответную реакцию в конечном счете правильной.

Образец данных, полученных в результате множественных экспериментов данного типа, приведен на рис.14. Несмотря на то, что голубь научился узнавать цвет при постоянном подкреплении, это на самом деле оказалось предпочтением конкретного цвета при условии непрерывного подкрепления. Всегда, когда образец был красным, глубь выбирал и его, и красную клавишу (ключ) и получал подкрепление. Когда образец был зеленым, голубь не реагировал, и боковые (клавиши) не освящались. Результат, показанный в начале графика на рис. 14, является высокой степенью процесса ответных реакций на верхнем график, что отражают совпадающие [с. 215] ответные реакции. (Запись на самом деле скачкообразна, т.к. отражает присутствие или отсутствие красного образца, однако это было утеряно из-за редукции на рисунке) Цветовое предпочтение, однако, не является решением проблемы противоположностей. Путем смены на эту проблему, стало возможным изменить поведение птицы как показано между двумя вертикальными линиями на рисунке. Верхний изгиб между этими линиями показывает уменьшение совпадений ответных реакций, которые вытекают из предпочтения цвета. Нижний изгиб между теми же линиями показывает развитие реагирования на противоположный цвет и его выбор. На второй вертикальной линии подкрепление снова пришло в соответствие с ожиданием. Верхний изгиб показывает восстановление ожидаемого поведения, в то время как нижний изгиб показывает понижение выбора противоположного цвета. Результатом было решение: голубь выбирал образец, вне зависимости от цвета, а затем, соответствующий боковой ключ. Более светлая линия соединяет возможную (means) серию точек на двух изгибах. Похоже, тут наблюдается та же самая закономерность, что и в случае выбора: изменения в распределении ответных реакций между двумя ключами не включает общее количество ответных реакций на ключ. Это среднее значение не будет оставаться константным в ошибочном решении, достигнутом с предпочтением цвета, как в начале графика.

Эти эксперименты над высшими процессами были описаны очень кратко. Они не предлагаются как доказательство того, что теории научения необязательны, но они могут предложить альтернативную программу в этой сложной области. Данные в сфере высших психических процессов превышают единичные ответные реакции или одиночные стимульно-реактивные взаимоотношения. Их возможно сформулировать в терминах дифференциации конкурирующих ответных реакций, различения стимула, образования различных последовательностей ответных реакций и т.д. кажется, не существует никакой априорной причины почему полный отчет не возможен без обращения к теоретическим процессам в других системах измерения.

Заключение.

Возможно, работа без теорий в целом – это tour de force, ожидать применения которого как общей практики было бы слишком. Теории – забава. Вероятно, что наиболее быстрый прогресс на пути к пониманию научения может быть достигнут путем проведения исследований, не направленных на проверку теорий. Адекватный импульс к этому может быть предоставлен тенденцией приобретать данные, показывая систематически организованные изменения, характерные для процесса научения. Приемлемой научной программой является сбор информации данного типа и установление их связей с переменными, выбранными для изучения при применении здравого смысла.

Такой подход не исключает возможности понимания теории в другом смысле. Над совокупностью однородных (неизменных) взаимосвязей находится [p. 216] необходимость формальной репрезентации данных, редуцированная до минимального количества понятий. Теоретическая конструкция может привести к большей степени обобщенности, чем любое скопление фактов. Такая конструкция не будет, однако, относится к другой системе измерений, и, таким образом, не будет являться частью нашего настоящего определения теорий.

Она не будет мешать нашему поиску функциональных взаимосвязей, поскольку проблема встает только после нахождения и изучения соответствующих переменных. Хотя это сложно для понимания, однако, это также сложно понять неправильно, и это не будет иметь тех вызывающих возражения эффектов, обсуждавшихся уже в этой статье.

Мы еще пока не готовы к теориям в таком смысле. В настоящий момент мы малоэффективно используем эмпирическое, уже не говоря о рациональном уравнивание. Немногие из представленных здесь графиков могли бы близко совпадать. Однако простейшее предварительное исследование показывает, что существует множество релевантных переменных, и до тех пор, пока их важность будет экспериментально доказана, уравнение, которое их учитывает, будет иметь столько произвольных констант, что точное совпадение будет являться чем-то само собой разумеющимся и принесет немного достоверности.

Примечание.

[1] Обращение президента, Midwestern Psychological Association, Чикаго, Иллинойс, Май, 1949.

[2] Некоторые из последующих материалов были получены в 1941-42 годах в время совместного исследования голубей, в котором сотрудничали Keller Breland, Norman Guttman, и W. K. Estes. Некоторые из материалов были выбраны из более поздних, но еще не опубликованных работ по исследованию голубей, проведенных автором в Университете Индианы (Indiana University) и Гарвардском Университете (Harvard University). Ограниченность места не позволяет сообщить все детали в данной статье.

[3] Оно (выполнение), не может быть сокращено либо увеличено. Там, где латентный период производится ˝насильно˝, чтобы минимизировать ценность дифференциального подкрепления, требуется другое объяснение. Несмотря на то, что можно дифференциально подкреплять более энергичное поведение или максимально быстрое окончание поведение после его начала, все же речь о дифференциальном подкреплении ответных реакций с короткими и длинными латентными периодами является бессмысленным. Что мы действительно дифференциально закрепляем, так это (а) ожидание поведения и (б) более энергичную ответную реакцию. Когда мы просим субъекта дать ответную реакцию ˝максимально быстро˝ в эксперименте измерения реакции на стимул, мы по существу спрашиваем его (a) произвести как можно больше ответных реакций без достижения критерия эмиссии (распространения), (б) не делать ничего другого, и (в) энергично отвечать после дачи стимула. Это приводит к самому минимальному времени между стимулом и реакцией, которое возможно, но это время не обязательно является исходным, да и наши инструкции его не сильно изменяют. Необходима параллельная интерпретация дифференциального подкрепления длительных задержек между стимулом и реакцией. В уже упомянутых экспериментах с голубями, предварительное (начальное) поведение уже обусловлено, что отсрочивает ответные реакции на кнопку до определенного времени. Поведение, которое ˝отмечает время˝, обычно бросается в глаза.

[4] Справедливо, что она (гипотеза) апеллирует к стимуляции, частично сгенерированной поведением самого голубя. Это может быть сложным для спецификации или манипуляции, но это не является теоретическим в настоящем смысле. Насколько мы можем стимулировать идентичное совпадение действий и стимуляции, возможна физическая спецификация.

[5] Две топографически независимые ответные реакции, способные в то же время на распространение, и, таким образом, не требующие переделки, показывают отдельные процессы восстановления, угасания и комбинирования ответной реакции.

Дата добавления: 2015-07-12; просмотров: 75 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Почему возникает научение?	\|	V.Изучение материала

mybiblioteka.su - 2015-2025 год. (0.009 сек.)