Аверсивное подкрепление

Читайте также:

Аверсивным подкреплением называют такие средства контроля поведенческих реакций животного или человека, которые вызывают болевые или неприятные ощущения. Различают два вида аверсивного подкрепления: наказание и негативное подкрепление.

Наказание – это любой аверсивный стимул, который следует после определённых действий и вызывает субъективно неприятные ощущения. Наказание должно изменять поведение так, чтобы определённые действия в будущем не совершались. Если ребёнок не может удержаться от соблазна прикоснуться к пламени свечи и в результате обжигается, то приобретённый навык удерживает его от искушения повторных опытов такого рода. Некоторые сторонники бихевиоризма склонны объяснять в рамках своей теории применение штрафных санкций и лишение свободы в качестве аверсивного подкрепления противоправных действий человека. Однако Скиннер считал наказание неэффективным способом контроля поведения, не способным предупредить склонность к нарушению каких-либо правил, тем более, если вероятность наказания мала. Так, например, водитель, оштрафованный за превышение скорости, не отказывается от быстрой езды, если только не опасается встретить инспектора с радаром, а отбывшие наказание в колонии правонарушители нередко становятся рецидивистами. Скиннер полагал, что поведение человека следует формировать с помощью позитивного подкрепления, а не наказания.

Негативное подкрепление выражается реакциями, направленными на избавление от уже действующих аверсивных стимулов или на предупреждение их действия. Если наказание приводит к прекращению каких-либо нежелательных действий, то негативное подкрепление способствует выполнению действий, направленных на избегание аверсивных стимулов. Реакцию избегания легко можно выработать у крысы, если включить метроном, а затем пропустить электрический ток по проволочному полу половины клетки, где сидит крыса. Спасаясь от болезненного действия тока, крыса перебегает на другую, безопасную половину клетки. После нескольких подобных опытов крыса начинает перебегать на противоположную половину сразу после включения метронома, ещё до того, как подействует электрический ток. Используя другую схему опыта, можно научить крысу нажимать рычаг для выключения пропускаемого по полу электрического тока.

Негативное подкрепление, влияющее на поведение человека, стимулирует действия, направленные на избегание субъективно неприятных ситуаций. Можно привести множество тому примеров, от запасания продуктов на «чёрный день» до сооружения укрытий от зноя, стужи, дождя и т.п. Подобная стратегия поведения основана на предшествующем опыте, и бихевиористская теория объясняет её как научение избегания. Но, поскольку эта же самая теория выводит поведение только из индивидуального опыта, всякое научение избегания должно произойти лишь в результате испытанного лично длительного голода, изнурительной жары, лютого холода, проливных дождей. Для оперантного научения методом проб и ошибок весьма желательно, чтобы подобные испытания человек перенёс неоднократно - тогда в дальнейшем он научится их предупреждать. Бессмысленно спорить с тем, что аверсивные стимулы имеют немалое значение при выборе стратегии поведения, что нашло отражение даже в пословицах («рыба ищет, где глубже, а человек – где лучше»). Однако совершенно не обязательно испытать весь набор неприятностей лично: большинство людей склонно учитывать не только собственный, но и чужой опыт. Однако для перенимания чужого опыта необходимы сознание и мышление, а они в концепции бихевиоризма отсутствует.

10.5.4. Формирование поведения путём последовательного приближения

Стандартный вариант оперантного научения оказался не пригоден для формирования сложного поведения, состоящего из упорядоченной последовательности действий, которые должны следовать одно за другим пока не будет достигнута конечная цель. Скиннер предложил рассматривать путь предстоящего научения в виде сменяющих друг друга этапов и подкреплять правильные действия животного при переходе от этапа к этапу. Этот способ формирования сложных образцов поведения получил название метода последовательного приближения. Если вознаграждать животное за каждое действие, приближающее к конечной цели, то постепенно эта цель может быть достигнута, а выработанный в процессе дрессировки навык сложного поведения сохраняется.

Для того чтобы научить крысу нажимать на рычаг в ящике Скиннера, в первых опытах её учат находить кормушку, в которую экспериментатор периодически отправляет шарик твёрдого корма. После этого крысу учат подходить к кормушке по щелчку, который всегда предшествует появлению корма. После того, как крыса научилась подбегать к кормушке сразу после щелчка, поблизости устанавливают рычаг манипулятора и дают подкрепление за приближение к нему. На следующем этапе подкрепляют обнюхивание рычага, а затем прикосновение к нему и, наконец, нажимание на рычаг. После этого корм подаётся автоматически после каждого воздействия на рычаг, который постепенно поднимается и крысе приходится к нему тянуться. Наконец, рычаг оказывается настолько высоко, что крысе приходится вставать на задние лапы, чтобы до него дотянуться – только в этом случае она получит подкрепление.

Дата добавления: 2015-07-10; просмотров: 502 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Условное подкрепление	\|	Латентное научение

mybiblioteka.su - 2015-2025 год. (0.006 сек.)