Относится к сборнику статей теори МВАП https://t.me/thinking_cycles
Принципиальная структура цепочек реагирования
Все цепочки реакций организованы как последовательность звеньев, каждое из которых запускается своим пусковым стимулом, который может быть сигналом окончания работы предыдущего звена (проприорецепторы) или самостоятельным стимулом, или их сочетанием. Это позволяет осуществлять действие адекватно изменениям условий или результату самого действия.
Такой принцип был оптимизирован эволюцией, начиная с самых древних цепочек реагирования (инстинктов), звенья которой являются наследственно предрасположенными (безусловными рефлексами). В организмах, где еще нет системы примитивов восприятия, формирующихся в онтогенезе (неокортекса), пусковые стимулы активируются от древней системы восприятия на основе подкорковых и стволовых структур мозга. Эта система способна лишь к примитивной сенсорной интеграции и модуляции реакций на основе внутреннего состояния организма (голод, стресс, циркадные ритмы и т.д.), которая не учитывает особенности окружения, как это делает неокортекс (у которого иерархия примитивов восприятия отражает текущее окружение).
Далее - три примера цепочек реакций инстинктивного поведения, иллюстрирующие указанные типы ветвления:
1. Срабатывание от сигнала окончания предыдущего звена (проприорецепторный контроль)
Инстинкт: забота о потомстве у грызунов (например, мыши)
Пусковой стимул: рождение детёнышей → активация материнского поведения.
Звено 1: сбор детёнышей в гнездо (вызывается обонятельными сигналами от новорождённых).
Окончание звена 1: все детёныши находятся в гнезде → проприорецепторный сигнал (например, снижение двигательной активности и тактильного возбуждения).
Звено 2: уход за детёнышами (лизание, кормление) запускается не новым внешним стимулом, а фактом завершения предыдущего звена — система «понимает», что сбор окончен, и переходит к следующему этапу.
Здесь переход обусловлен внутренним сигналом о завершении действия, а не изменением внешней среды.
2. Срабатывание от нового пускового стимула, отражающего изменение ситуации
Инстинкт: защитное поведение у птиц (например, курицы при появлении хищника)
Пусковой стимул: визуальное обнаружение хищника (движущаяся тень сверху).
Звено 1: издаётся тревожный крик → птенцы замирают или бегут к укрытию.
Изменение ситуации: хищник приближается → новый пусковой стимул (увеличение углового размера объекта, звук крыльев).
Звено 2: курица бросается в атаку или имитирует ранение (отвлекающее поведение) — запускается новым стимулом, а не завершением предыдущего действия.
Переход обусловлен обновлённой сенсорной информацией, сигнализирующей об эскалации угрозы.
3. Срабатывание от комбинации проприорецепторного сигнала и изменения условий
Инстинкт: постройка гнезда у певчих птиц (например, зяблика)
Пусковой стимул: увеличение длины светового дня + гормональный фон → поисковое поведение места для гнезда.
Звено 1: выбор места и начало строительства (сбор веточек).
Проприорецепторный сигнал: достигнута достаточная глубина чашеобразной структуры (оценивается тактильно/кинестетически).
Изменение условий: начинается дождь → влажность и температура меняются.
Звено 2: птица переключается на сбор водонепроницаемого материала (мха, перьев) — только если (а) основа гнезда уже построена (проприорецепторный сигнал завершения этапа) и (б) обнаружено ухудшение погоды (новый стимул).
Таким образом, переход к следующему звену требует двух условий: внутреннего (завершение этапа) и внешнего (изменение среды).
Этим демонстрируется то, как двумя критериями (стимул и проприорецептор) обеспечивается любая сложность инстинктивного реагирования.
Комбинация всего двух фундаментальных критериев активации звеньев поведенческой цепи - внешнего (или внутреннего) пускового стимула, отражающего изменение ситуации в среде или организме, и проприорецепторного сигнала, свидетельствующего о завершении предыдущего звена, позволяет эволюционно древним, генетически закреплённым программам (инстинктам) достигать высокой адаптивной сложности, несмотря на их «жёсткую» природу.
Эти два канала управления — событийный («что происходит вокруг/внутри?») и последовательностный («что уже сделано?») — образуют базовую архитектуру для:
• ветвления (выбор альтернативного пути в зависимости от контекста),
• возврата (повтор попытки при неудаче, если конечный стимул не достигнут),
• прерывания (переключение на другую цепочку при появлении доминирующего стимула, например, угрозы),
• вложения (запуск вложенной подпрограммы, например, ухода за раной в ходе миграции).
Таким образом, даже в отсутствие гибкой онтогенетической перцептивной системы (типа неокортекса) организм способен реализовывать условно-адекватное, многоуровневое поведение, где каждое действие учитывает и текущее состояние среды, и прогресс выполнения самой программы.
Сигналом изменений условий может быть изменения сенсорики следующих видов (интернальные и экстернальные стимулы).
1. Базовое изменение состояния организма (выход жизненных параметров из нормы и возврат в норму и распознаванием момента, когда становится возможным совершать действия, непосредственно возвращающие норму в виде состояния Хорошо, поддерживающее продолжение действий для возврата в норму). Общим (совокупным) стимулом оказывается изменение сочетаний активных базовых контекстов - стилей поведения (пищевое, поисковое, половое, защитное и т.п.), что на уровне психики составляет эмоциональный контекст.
2. Изменения в отражении признаков внешнего восприятия, которые связываются с необходимостью изменения активности звеньев реагирования.
Оба вида стимулов в древней (до неокортекса) системе осуществляются врожденными реакциями.
Использования двух критериев (стимул и проприорецептор) - это ключевой принцип эволюционной экономии: сложность поведения достигается не за счёт произвольной гибкости, а за счёт конечного, но эффективного набора правил переключения между заранее заданными звеньями.
Этот принцип остается неизменным во всех структурах реагирования вплоть до реакций, формирующихся осознанной произвольностью. Разница между инстинктивным и осознанным поведением заключается не в фундаментальной структуре цепочки, а в происхождении и гибкости компонентов.
Пусковой стимул на высшем уровне может быть внутренне генерируемым (например, решение начать писать текст), но он всё равно выполняет ту же функцию — инициирует звено.
Сигнал завершения также становится интернализованным: вместо проприорецепторов — внимание и самонаблюдение, фиксирующие достижение промежуточной цели («абзац написан» → можно переходить к следующему).
Это означает, что осознанное произвольное поведение — не разрыв, а эволюционное продолжение той же архитектуры, где древние механизмы «разгружаются» в корковые структуры и становятся управляемыми через внутренние модели, языковые конструкции и символическое планирование.
Следовательно, принцип двойного контроля (стимул + состояние завершения) действительно является инвариантом всех уровней реагирования — от безусловного рефлекса до целенаправленного творчества.
В общем случае два инвариантных критерия – это 1) стимул от изменения условий реагирования и 2) разрешение запуска последующего звена от предыдущего.
Вся система ветвящихся цепочек инстинктов строится как жесткая логика наследственных механизмов детекции ключевых изменений условий, которая и управляет ветвлением цепочек реагирования с изменением условий. В рамках постоянства условий цепочки разворачиваются по критерию последовательного выполнения.
В целом все выглядит просто как запуск определенного звена наследственной реакции по возникшему состоянию условий, что прерывает выполнение активной цепочки и активирует звено новой последовательности.
В случае искусственной реализации живых существ этот оптимизированный эволюцией универсальный принцип должен использоваться без каких-то попыток обойти эти наиболее базовые критерии организации.
Игнорирование этого эволюционно отшлифованного принципа организации поведения приводит к фундаментальным ограничениям: хрупкости, неадаптивности, отсутствию устойчивой мотивации и неспособности к автономному целеполаганию в меняющейся среде. Попытки заменить внутренние сигналы завершения на внешние таймеры, эвристики или чисто стимульные триггеры ломают причинно-целевую связность поведения. Система теряет способность «знать», что она уже сделала — и начинает либо зацикливаться, либо прерывать действия преждевременно.
Игнорирование мотивационного контекста превращает агента в реактивную машину, лишённую приоритезации. В реальной среде это означает неспособность выбирать между «есть» и «бежать» — а значит, гибель.
Поэтому любая устойчиво автономная искусственная система, претендующая на адаптивное поведение, должна воспроизводить эту базовую архитектуру — не как метафору, а как функциональную основу.
Включение неокортекса
Появление последовательно усложняющейся системы распознавателей примитивов восприятия дало мощный и гибкий путь появления новых адаптивных механизмов на основе предыдущих.
Активация распознавателей образа в неокортексе, совпадающая с активацией инстинкта, при наличии созревшего нейрона в моторной области неокортекса приводит к переводу цепочки древнего инстинкта к абстрактному образу элемента действия и появлению массива распознавателей запуска цепочки в области, контролируемой системами осознанного восприятия в лобной коре. Это, в первую очередь, позволяет эмпатийно активировать те образы действия, которые наблюдаются в поведение другого субъекта и использовать их как авторитетно отзеркаленные действия на те условия, которые ранее не были задействованы в реагировании.
Когда субъект наблюдает за действием другого, его сенсорные системы активируют аналогичные перцептивные образы, а зеркальные (или функционально подобные) нейронные системы — соответствующие моторные репрезентации.
Если в это время мотивационный контекст наблюдателя совместим (например, он тоже голоден, тоже в ситуации угрозы), то образ действия другого не просто распознаётся, а ассоциируется с собственной инстинктивной программой, и, при наличии пластичности, становится новым триггером для запуска аналогичного поведения даже в незнакомой ситуации.
Это — эмпатийное обучение, не требующее проб и ошибок, а опирающееся на авторитетный перенос («если он так делает и выживает — значит, это работает»).
Созревание префронтальных структур позволяет:
• Удерживать активированный образ действия в рабочей памяти,
• Произвольно инициировать связанную с ним поведенческую цепь,
• Моделировать последствия, не запуская действие напрямую.
Таким образом, массив распознавателей, сформированный через интеграцию восприятия и инстинктов, становится доступным для осознанного контроля. Субъект может мысленно «прогонять» действия, выбирать между альтернативами и имитировать поведение других не потому, что «понимает» его логику, а потому, что его внутренние программы уже связаны с соответствующими образами.
Это объясняет, почему даже самые сложные формы человеческого поведения — от ритуалов до научного творчества — всё ещё опираются на те же два базовых критерия (1) стимул - изменение условий (воспринимаемое или воображаемое) и/или (2) разрешение - внутренний сигнал о состоянии действия.
Любая искусственная система, претендующая на подлинную адаптивность, должна не просто имитировать интеллект, а воссоздавать эту иерархию встроенных мотиваций, перцептивных якорей и моторных связей, с возможностью их онтогенетического расширения через социальное взаимодействие. Она должна обладать набором врожденных реакций, которые при развитии дерева иерархии распознавания образов (fornit.ru/66797) становятся основой образов элементарных действий, сцепляющихся в последовательности реакций, отражающих инстинкт – для использования в системе осознанного восприятия-действия.
Если первоначально инстинкты ничего не знали про дерева условий (стимулов), то уже с самого начала развития в онтогенезе они переводятся в образы восприятия и действия (fornit.ru/70785), которые становится возможным использовать осознанной произвольностью. Инстинкт не заменяется, а обрастает перцептивно-моторной оболочкой, которая позволяет ему функционировать в пространстве образов, а не только в пространстве рефлекторных дуг.
В результате осознанного формирования новых цепочек реагирования или коррекции старых (но уже переведенных в абстрактные), возникает все та же преемственная структура ветвления цепочек по двум описанным критериям: стимула и разрешения запуска, потому что еще на уровне инстинктов такая структура была максимально унифицирована.
Такая структура легко вкладывается сама в себя:
• Звено может быть простым рефлексом или сложной подпрограммой,
• Подпрограмма может содержать вложенные ветвления по тем же двум критериям.
• Это позволяет строить иерархические поведенческие деревья без изменения базовых правил.
Эволюционное дополнение дерева условий на уровне осознанного реагирования
Новая находка эволюции для поддержания целостности контекста реагирования – тема осознанного восприятия (fornit.ru/71308), организуемая на уровне глобальной информационной картины, являющейся общим контекстом итераций приближения шагов осмысления к целевому результату – действиям, альтернативным привычному в новых условиях.
Информация о теме развивается эволюционно от простейшего сигнала текущего состояния организма (норма-плохо-хорошо), дающего цель – улучшение этого состояния в случае отклонения от нормы гомеостатических параметров, далее – информации о сочетании базовых стилей (пищевое, поисковое, половое, защитное и т.п.) в виде абстрактного образа эмоции (эмоционального контекста) и в последующем развитии – образа сочетаний условий восприятия, характерного для темы осознания.
Образ темы становится дополнением дерева условий, так что становится стимулом нового качества для того, чтобы обеспечивать целостность формирования цепочек реакций при осмыслении. Это дополнительное звено ветки дерева условий оказывается в составе структуры нового уровня исторической памяти (в дополнение к имеющейся семантической составляющей) – эпизодам осмысления, позволяя сохранять правила реагирования в зависимости от значимости условий и темы с оценкой результата такой реакции.
В искусственном прототипе системы индивидуальной адаптивности Beast дерево условий было дополнено звеньями “ситуаций”, дающим условия работы процесса осознания, хотя первичные автоматизмы крепились к образам более древнего дерева условий. Но уже новые автоматизмы – продукты осмысления использовали образ ситуации. И в такой архитектуре видится возможность использования темы осознания в качестве ситуации, задавая это звено ветки дерева не искусственно (т.к. не видно, откуда бы могло происходить такой массив ситуаций), а в виде осознанно выделяемой категории темы осмысления. Это бы хорошо унифицировало архитектуру, хотя для искусственной реализации и необязательны требования наследственной природы образа ситуации, но без этого структура оказывается тупиковой.
Темы осознания становится высшим пусковым стимулом для формирования новых цепочек реакций.
Даже в ИИ нельзя обойтись без «врождённой» основы для ситуаций — не в смысле предзагруженных сценариев, а в смысле:
• Архитектурно заданной способности выделять тему как устойчивую категорию,
• Наследственного механизма оценки значимости (что делает один контекст «ситуацией», а другой — просто фоном?),
• Встроенной функции сохранения эпизодов осмысления с привязкой к теме.
Без этого дерево условий теряет семантическую глубину: оно становится ассоциативной сетью без мотивационной оси, где любая комбинация признаков может стать «ситуацией», но ничто не определяет, что из этого важно для выживания/адаптации. Именно поэтому без врождённой функции тематизации система не может самостоятельно строить иерархию значимых контекстов.