Несколько априорных соображений к моделированию системы «хочу»/wanting

Читайте также:

Некоторые существа обладают четко определенной, ограниченной системой потребления: насекомое, которое питается листьями только одного растения, или коала, поедающая листья только четырех видов эвкалиптов. Вкусовые предпочтения таких существ являются врожденными. Другие существа являются в большей степени оппортунистами и адаптируют свои системы потребления к тому, что имеется в наличии. Человек и крыса являются высокоразвитыми существами в рамках этого континуума. Некоторые из наших желаний являются врожденными, но большинство наших желаний пластично.

Помыслим абстрактно о том, как существо с пластичными деланиями будет структурировать потребление. Предположим, что это существо умеет пробовать предлагаемую пищу и определять, насколько эта пища хороша для него с точки зрения удовлетворения его потребностей. Существо может делать это, в основном, пользуясь механизмом удовольствия — чем лучше пища, тем больше удовольствия она приносит — хотя, на самом деле, как мы полагаем, удовольствие здесь участвует не всегда (объяснения ниже). Поэтому скажет просто, что существо умеет определять, насколько хороша для него пища. Предположим также, что целью нашего существа является максимальное потребление того, что для него хорошо. Как оно будет это делать?

Первый способ: существо пробует все, что ему встречается, чтобы понять, хорошо это или плохо, и съедает то, что оказалось хорошим; вполне очевидно, что этот способ неэффективен — он требует вновь и вновь пробовать те вещи, которые уже однажды были отвергнуты как «плохие». Второй способ: существо научается тому, что для него является хорошим, в полном смысле слова: существо развивает в себе убеждения относительно того, какая пища для него хороша, а затем, при появлении желания съесть это «хорошее», формирует деятельное желание этой пищи.[31] Третий способ: избежать формирования убеждений в принципе. Вместо этого существо будет непосредственно формировать свои желания на основании того, что им было определено как «хорошее». Иными словами, оно сможет формировать внутреннее желание хорошей пищи безотносительно каких-либо убеждений или ожиданий относительно таковой.

У третьего способа есть определенные преимущества. Его проще и легче применять, чем систему, основанную на убеждениях, и, в некоторых случаях, он более надежен. Представим себе, как он работает. Рассматриваемое нами существо должно сделать две вещи: 1) ему нужно сформировать свои желания относительно конкретной пищи; 2) в присутствии такой пищи ему нужно действовать, основываясь на этих желаниях. Для этого существу понадобится использовать две системы: систему формирования желаний, которая создает внутреннее желание пищи, и систему потребления, которая регулирует потребление существа в соответствии с этими желаниями. Эти системы должны концептуально различаться, даже если в их функционировании может наблюдаться некоторое наложение (некоторые причины тому мы рассмотрим ниже). Итак, у нас имеется:

(i) Система формирования желаний. В ее функции входит идентификация каждого образца как принадлежащего к определенному типу пищи; определение, сколько «хорошего» существо получит от этого типа пищи; на основании такого определения — посыл сигнала в систему потребления, которая будет регулировать последующее желание существа потреблять пищу этого типа. Назовём это A-сигналом.

(ii) Система потребления. Установки этой системы определяются A-сигналом. Встретив потенциальную пищу, система должна будет определить ее принадлежность к тому или иному типу пищи, а затем среагировать на это путем посыла сигнала, в соответствии с установками для этого типа пищи, который регулировал бы потребление этой пищи. Назовём его Б-сигналом.

Весьма сложен вопрос употребления термина «желание» (до сих пор мы не обращали на это внимания). Этот термин может употребляться для обозначения диспозиционального состояния системы потребления: ее тенденция определенным образом реагировать на определенную пищу в соответствии с определением А-сигнала. Кроме того, он может обозначать состояние, возникающее в результате включения указанного выше диспозиционального состояния: изменяющееся состояние, являющееся Б-сигналом или вызванное им.[32] В обоих случаях наблюдается хорошее философское и лингвистическое обоснование терминов. Для того, чтобы отделить из друг от друга, назовем первый случай «диспозициональным желанием», а второй «изменяющимся желанием».[33] Таким образом, система формирования желаний формирует диспозициональные желания, а система потребления формирует изменяющиеся желания при возникновении диспозициональных желаний.

Рассмотрим работу этих систем подробнее. Поскольку разные образцы одной и той же пищи могут варьироваться в уровне хороших качеств (всем известно, что одна ягода клубники может быть превосходной, а другая — безвкусной), у нашего существа может появиться очевидная стратегия: попробовать одну и ту же пищу несколько раз и выявить «средний уровень» хорошего, которое оно получает из набора образцов продуктов, а затем регулировать свое желание относительно этого среднего уровня. Как оно это сделает?

В первую очередь, рассмотрим процесс вычисления «среднего» из набора образцов определенного продукта. Конечно же, наше существо может записывать качества каждого попробованного образца, суммировать их и разделить результат на количество образцов. Однако такие расчеты подразумевают работу с большим количеством ненужных данных, что было бы сложно для биологической системы. Кроме того, это означало бы, что вплоть до завершения «ознакомления» с продуктом у существа не было бы предварительного результата.

Есть более простой способ, который обеспечивает предварительный результат: необходима промежуточная средняя величина и запись о количестве испробованных образцов. В этом случае наше существо сможет «обновлять» среднюю величину при ознакомлении с каждым новым образцом. Предположим, что на данный момент существо попробовало n образцов, определило ценность (V) каждого и рассчитало среднюю величину (mean_n). Теперь существо пробует следующий образец n+1, ценность которого V_n+1. Для того, чтобы рассчитать новую среднюю величину (mean _n+1), существу нужно всего лишь определить, насколько ценность нового образца отличается от существующей средней величины, взвесить эту разницу, разделив ее на количество образцов и прибавить результат к существующей средней величине. В виде уравнения это выглядит так:

mean_n+1 = mean_n+ (1/(n+1) [V_n+1 – mean_n])[34]

Данное правило обновления, учитывающее разницу между текущим образцом и предыдущей средней величиной (или же, как говорится в литературе, погрешность между прогнозом и текущим образцом), является основой большинства методов обучения с подкреплением; механизм, основанный на этом правиле, может использоваться для получения новых убеждений. Это системы научения, упомянутые нами при обсуждении теорий обучения и того, как ими рассматривается роль дофамина. Отметим, что такое правило необязательно должно быть привязано к системе научения. Оно же может использоваться в данной структуре для непосредственного формирования новых желаний.

Для того чтобы использовать это правило, системе формирования желаний потребуется (i) идентифицировать обнаруженный образец как принадлежащий к определенному виду продуктов; (ii) получить средний уровень хороших качеств этого продукта (mean_n) и количество известных образцов (n); (iii) зарегистрировать уровень хороших качеств, полученных от данного образца (V_n+1); а затем (iv) произвести расчет. На деле система формирования желаний не обязательно посылает среднюю величину системе потребления. Все, что ей требуется — отправить новую информацию, полученную от каждого нового образца, и система потребления использует её для соответствующей модификации диспозициональных желаний. Для этого ей нужно отправить сигнал, соответствующий (1/(n+1) [V_n+1 – mean_n]). В литературе по системам обучения этот сигнал называется «сигналом погрешности» или «сигналом научения»; но, поскольку в нашем случае речь идет о системе, основанной на желаниях, а не на убеждениях или прогнозах и, следовательно, мы не говорим о научении в прямом смысле слова, мы будем придерживаться изначального положения и использовать термин «А-сигнал».

Система потребления начинает использовать А-сигнал для регуляции собственной деятельности, создавая диспозициональные желания. Как она это делает? Во-первых, система формирования желаний может послать не только А-сигнал, но и сведения об идентичности образца. Однако отправка такой информации — дело сложное и, в основном, избыточное. Если система потребления будет использовать переданную ей информацию, ей все равно придется отнести потенциальную пищу к той или иной категории продуктов. Поэтому она скорее не будет требовать дополнительной информации об идентичности образцы, но будет использовать базовый ассоциативный механизм. Получив А-сигнал, она сформирует желание в отношении любого типа пищи, идентифицируемой как потребляемой в настоящий момент. Это означает, что система подвержена определенной погрешности: если она получает А-сигнал в тот же самый момент, когда идентифицирует конкретную пищу как потребляемую, то система припишет данную информацию к этой пище, даже если последняя не является источником данного сигнала (не является источником в стандартном понимании). Это чрезвычайно важно для нашего понимания аддикции.

Подведем итог: система потребления создает свои диспозиции (диспозициональные желания) на основании двух входных сигналов: силы А-сигнала и собственной идентификации того, что потребляется в момент получения А-сигнала. На основании этих диспозиций система отправляет соответствующий Б-сигнал в момент распознавания продукта как принадлежащего к определенной группе. Этот Б-сигнал, в свою очередь, определит структуру потребления.

Модель, представленная нами, похожа на упрощенную модель взаимодействия актера и критика: система потребления — актёр, система формирования желаний — критик.[35] Противоборствующие модели сочетают обе роли, и такой подход представляется привлекательно экономичным. К примеру, не может ли всего один сигнал служить и для формирования диспозиционального желания, и для стимуляции изменяющегося желания? Не отметая такой возможности, мы все же будем продолжать работать с двухсистемной моделью по нескольким причинам. Во-первых, как мы говорили ранее, даже если системы не реализованы по отдельности, имеет смысл различать их концептуально. Во-вторых, имеется твердое подтверждение тому, что крысы используют модель «актёр-критик», и мы обсудим это в следующем разделе. В-третьих, у существа, у которого эти системы (и, следовательно, А- и Б-сигналы) раздельны, имеется явное преимущество.

Чтобы убедиться в этом, рассмотрим роль аппетита. Никакое существо ничего не приобретет, если будет потреблять сверх необходимого. Насытившись, существо должно прекратить есть. Ещё лучше, если существо сможет регулировать аппетит, основываясь на потребностях, имеющихся в данный момент. Если у существа есть большое количество одного питательного вещества и недостаточное количество другого, ему следует усилить желание к последнему относительно желания к первому. Преимущество двухсистемной модели заключается в том, что она позволяет существу делать это, получая одновременно ценную информацию. Чтобы подтвердить это, приведем простой — очень простой! — пример. Предположим, что наше существо удовлетворило потребность в сахаре, но ему все еще нужна вода. Существо пробует новый продукт и понимает, что в продукте содержится много сахара, но совсем нет воды. Существу не следует формировать изменяющееся желание употребить этот продукт, ему следует продолжать поиски. Вместе с этим было бы полезно, чтобы информация о насыщенности данного продукта сахаром оказала бы некоторое влияние на диспозициональное желание нашего существа; в конце концов, когда оно в следующий раз обнаружит этот де продукт, существу может как раз не хватать сахара. При наличии системы, в которой А-сигнал и Б-сигнал раздельны, существо сможет сделать такое различение. Аппетит регулируется на уровне системы потребления — путем контроля Б-сигнала. Исходя из этого, если испытывающее потребность в воде существо найдет богатую сахаром пищу, А-сигнал может быть инициирован, формируя диспозициональное желание. Но, поскольку существо не нуждается в сахаре, его Б-сигнал инициирован не будет, следовательно, не возникнет изменяющееся желание. Если же диспозиционное и изменяющееся желания регулировались бы только одним сигналом, было бы сложно понять, как один из них мог бы быть инициирован без включения другого.

Есть и еще одна потенциально важная проблема. Представленная нами модель вполне хороша (возможно, немного медленна) для реакций на относительно стабильные изменения — например, пища становится лучше или хуже и остается таковой в течение какого-то времени. Тем не менее, реальность зачастую преподносит нестабильные изменения: разные образцы одной и той же пищи могут демонстрировать значительные колебания качеств (всем нам, увы, знакомы колебания вкусов томатов и клубники). Предположим, что наше существо пробовало определенный продукт множество раз в прошлом и обнаружило, что этот продукт приемлем: его можно есть, если нет ничего больше, но он не настолько хорош, чтобы существо стало бы питаться только им и ничего больше не искать. Существо пробует этот продукт в очередной раз и обнаруживает, что он невероятно хорош. Как оно отреагирует? Разумеется, желание существа потреблять этот продукт в будущем возрастет, но это будет не скачкообразный рост: имеющийся у существа опыт подсказывает ему, что это — аномалия, что следующие образцы могут оказаться уже не такими хорошими. При этом было бы неразумно не получить все возможное от этого невероятно вкусного куска. Существо съест, сколько сможет, здесь и сейчас; оно не уйдет искать что-то еще и не станет есть другую пищу — она может быть вкуснее, чем «средний вариант», но хуже (по вкусу), чем данный образец.

Отсюда возникает необходимость, чтобы реакция существа была двусоставной: крупный, но непродолжительный прирост желания данного образца и меньший, но стабильный рост желания образцов этого же типа. Как этого можно добиться, если, по указанным выше причинам, изменяющееся желание регулируется только Б-сигналом, а не А-сигналом?

Авторы видят одну такую возможность. Даже если А-сигналы напрямую не приводят к возникновению изменяющихся желаний, они могут повышать эффективность сигналов, которые стимулируют возникновение таких желаний. Если изменяющееся желание формируется только Б-сигналом, сила воздействия Б-сигнала будет регулироваться силой текущего А-сигнала. Чем сильнее текущий А-сигнал, тем сильнее воздействие Б-сигнала. Это можно назвать моделью «усилителя». Она может реализовываться несколькими способами. Один из простых способов заключается в преобразовании изменения, вызванного А-сигналом в диспозициональном желании, в распределенное по времени. Допустим, первоначальное воздействие А-сигнала сравнительно велико, но оно быстро спадает и через незначительное время достигает нового, более низкого равновесного состояния. Так работает модель усилителя, вполне соответствующая традиционным моделям Хебба.[36]

Пожалуй, мы исчерпали все априорные соображения, не, прежде чем вернуться к анализу опытных данных, подведем итог. Существо, обладающее гибкой системой «хочу»/wanting, может изменить свои внутренние желания так, чтобы они сосредотачивались на вещах, которые приносили существу удовольствие или были иным образом ему благоприятны в прошлом. Если эта система использует два отдельных сигнала, А-сигнал, формирующий диспозициональные желания, и Б-сигнал, стимулирующий изменяющиеся желания при своем включении, то существо сможет изменять диспозициональные желания даже при отсутствии чувства голода. Если А-сигнал может также увеличивать интенсивность Б-сигнала, он может самостоятельно стимулировать потребление неожиданно вкусной порции пищи без непропорционального изменения диспозиционального желания. Авторы предпочитают не вдаваться в подробности этой теории, однако опытные данные показывают определенную правильность этой точки зрения.

Дата добавления: 2015-07-10; просмотров: 95 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Причинно-следственные связи механизмов Wanting и Liking	\|	ОПЫТНОЕ ПОДТВЕРЖДЕНИЕ НАЛИЧИЯ СИСТЕМЫ «ХОЧУ»/WANTING

mybiblioteka.su - 2015-2024 год. (0.008 сек.)