Концепция (кратко)

В настоящее время достигнуты огромные успехи в изучении механизмов работы нейронов, исследованиях общей связанности мозга и многих других направлениях нейронауки, получены впечатляющие результаты в области машинного обучения. Во многих задачах искусственным нейронным сетям удалось приблизиться к человеческим результатам или даже в определенных случаях превзойти их. Однако, до сих пор нет общего понимания тех принципов, которые лежат в основе работы мозга. Остается неясным, как работает память, как мозгом реализуется память, обобщение и многое, многое другое. Мы предлагаем непротиворечивую модель которая, находясь в полном соответствии со всеми известными биологическими данными, не только объясняет то, как функционирует реальный мозг, но и показывает в чем его работа принципиально отличается от работы существующих машинных алгоритмов.

Основные идеи, заложенные в модель:

В модели предполагается, что информация может распространяться в структурах мозга не только через передачу нервных импульсов по аксонам или через последовательную передачу возбуждений от одних нейронов к другим. Основой такой передачи могут являться слабые дендритные токи. В коротких сегментах дендритных деревьев токи возникают под действием миниатюрных постсинаптических возбуждающих потенциалов. Узор, образованный из активности таких дендритных сегментов, может распространяться по пространству коры.  Возникнув в каком-либо месте коры, паттерн активности вызывает распространение волнового фронта. Узор такого фронта уникален и зависит от того, какой исходный паттерн его породил. Одна и та же информация в виде пространственно распределенного паттерна активности может быть доступна всем нейронам внутри зон коры. Более того, каждый участок коры может быть как приемником, так и передатчиком информации.

Предложен механизм памяти, основанный на интерференции двух пространственных паттернов активности. В результате прохождения волнового фронта, несущего кодовый узор, в каждом месте коры образуется определенный паттерн активности дендритных сегментов. Активность нейронов в локальной области коры создает свой информационный паттерн. Интерференция узоров заключается в фиксации на элементах первого паттерна, являющегося ключом, меток, соответствующих комбинации активности элементов второго паттерна, несущего информационное содержание.

Показана возможность реализации механизма записи и извлечения информации по принципу “ключ – значение”.

Удалось описать роль кластеров мембранных рецепторов, как ключевых элементов, отвечающих за память, обучение и обобщение. Структура аксоно-дендритных переплетений создает пространство, в котором каждый локальный объемный сигнал активности нейронов приводит к тому, что в некоторых точках пространства возникает уникальное по отношению к этому сигналу сочетание нейромедиаторов. Образование в этих точках соответствующих кластеров рецепторов позволяет как запомнить, так и воспроизвести информационный сигнал.

Миниколонки коры – это группы из компактно расположенных нервных клеток. Каждая миниколонка содержит порядка сотни сильно связанных между собой нейронов. Кора – это совокупность миниколонок. Миниколонки выполняют роль самостоятельных смысловых процессоров. Каждая группа, относящаяся к одной зоне коры, получает одну и ту же входную информацию. Выполняет перекодирование этой информации в соответствии с правилами, уникальными для каждой группы. Полученный код является трактовкой исходной информации в контексте локальной группы нейронов. Пространство коры является пространством всех возможных контекстов или смыслов, которые нам доступны.

Поиск смысла в информации – это сравнение трактовки, полученной в контексте миниколонки с тем опытом, что хранится в памяти. Это позволяет обосновать тотальность памяти. Мы показали, что память не локализована где-то конкретно и не распределена везде. Каждая миниколонка хранит свою полную копию памяти, что позволяет ей определять, содержит ли смысл ее трактовка и делать это независимо от остальных миниколонок и параллельно с ними.

Например, у нас есть контексты, описывающие различные шрифты. Каждый контекст – это набор правил, переводящих детали буквы, характерные для шрифта, в их “стандартное” представление. Память хранит все буквы в их неком “стандартном” виде. Подадим на вход рисунок буквы. В каждом контексте возникнет своя трактовка, то есть описание того, как будет выглядеть буква после применения правил преобразования этого контекста. Только в том контексте, который соответствует шрифту поданной буквы, трактовка окажется осмысленной, то есть совпадает с описанием одной из букв, что хранится в памяти.

В рамках модели показаны не только механизмы формирования памяти, но и механизмы поиска закономерностей, основанные на том, что само пространство коры – это огромная совокупность случайных подпространств, позволяющих свести комбинаторно сложные задачи к большому количеству комбинаторно простых.

Каждая миниколонка содержит порядка миллиона синапсов. Когда часть из сотни нейронов миниколонки приходят в активность, вокруг каждого из синапсов образуется “коктейль” из нейромедиаторов и нейромодуляторов, состав которого определяется не всеми нейронами миниколонки, а только приблизительно пятой частью из них. В результате, каждый из синапсов становится аналогом подпространства, в котором идет наблюдение за частью сигнала, сформированного нейронами миниколонки. Кластеры рецепторов, расположенные на дендритной мембране способны создавать сочетания рецепторов, соответствующие закономерностям, присутствующим в поступающей информации.  

Есть основания полагать, что полученная модель, основанная на выделении смысла в информации идеально подходит для реализации механизмов обучения с подкреплением. Основная проблема построения оптимальных стратегий поведения – это возможность определения того, что текущая ситуация соответствует некому ранее полученному опыту. Определение “схожести” ситуаций по чисто внешним признакам не дает приемлемого результата. Очень часто мельчайшая деталь меняет смысл ситуации на противоположный. Использование пространства контекстов позволяет оперировать не формальной внешней стороной явлений, а ухватывать их суть.

Кроме того, наличие полной памяти у всех контекстов позволяет использовать опыт, полученный в одном контексте во всех остальных контекстах, которые приводят к аналогичным трактовкам. То есть, если у нас сформировался опыт по оперированию предметами на, например, письменном столе, то мы можем использовать этот опыт при манипулировании иконками на рабочем столе компьютера.

Использование заложенных в модель представлений о контексте, смысле информации, механизмах обучения с подкреплением, позволило описать механизм формирования свойственных человеку эмоциональных оценок.

Достижение результата, связанного с подкреплением, как правило требует предварительного совершения поступков, не несущих непосредственной выгоды. Например, рецепторному подкреплению, связанному с утолением голода предшествуют шаги, связанные с добычей и приготовлением пищи, сами по себе не дающие прямых вознаграждений. В таких обстоятельствах поведение строится исходя из повышения оценки качества текущей ситуации.

Эмоциональные оценки в терминах обучения с подкреплением как раз и являются оценками качества ситуации. Эти оценки удается сформировать за счет выбора правильного контекста для описания текущей ситуации и использования памяти, хранящей опыт оценок предыдущих событий.

В таком подходе удалось достаточно полно показать пути формирования свойственных людям эмоций и переживаний.