Концепция

Нет “нейронов бабушки”

Часто пытаются представить мозг, как совокупность нейронов, настроенных на детектирование определенных образов. Появилась “бабушка” – сработали нейроны, связанные с ней. Сейчас эта идея подвергается сильной критике.

Есть несколько основных идей нейронного кодирования (Neural coding), то есть идей относительно того, как информация представляется на нейронном уровне. Мы исходим из того, что в основе лежит не активность отдельного нейрона, а код, образуемый группой (Population coding). Экспериментально показано, что одни и те же нейроны могут активироваться в различных ситуациях. По активности одного нейрона не удается достоверно судить о происходящем. При этом по активности не одного нейрона, а группы можно точно указать, что происходит.

В концепции “нейронов бабушки” (Rate coding, Sparse coding), имея 100 нейронов можно закодировать 100 “бабушек”. При кодировании группой из 100 нейронов можно закодировать практически неограниченный набор понятий.

Коды мозга сложны и имеют семантическую природу

Очень похоже, что кодирование информации происходит не только за счет создания одномоментной картины активности нейронов, а за счет временной последовательности таких картин, объединенных в единый информационный пакет.  Это позволяет мозгу создавать сложные описания. В информатике необходимость создавать универсальные и мощные описания привела к созданию форматов, типа xml, json и тому подобных. Мы считаем, что можно провести достаточно сильные аналогии между этими форматами и методами кодирования, используемыми мозгом.

Говоря о семантической природе кодов, мы имеем в виду, что так же как мы используем слова в нашей речи, мозг использует богатую систему кодов, которые можно назвать словами внутреннего языка.

Нейроны не столько кричат сколько шепчут

Мы полагаем, что спайки нейронов (амплитуда которых составляет порядка 100 мВ) – это только верхушка информационного айсберга. Большая часть информационной работы происходит на амплитудах гораздо меньших (единицы милливольт). Основные “труженики мозга” – это миниатюрные постсинаптические потенциалы. Возникновение этих потенциалов – это не случайные флуктуации, как часто приходится слышать, а основная часть работы мозга.

При этом мы показываем, что миниатюрные постсинаптические потенциалы и вызванные ими токи могут являться не только частью механизма работы нейронов, но и частью системы распространения информации, используемой мозгом.

Может существовать волновое распространение кодов

Мы показали и смоделировали, что коды и связанную с ними информацию можно передавать в виде разбегающегося узора активности. То есть, определенный узор активности в одном месте коры в небольшом ее объеме (порядка 100 мкм вдоль поверхности коры) может вызывать возникновение, связанных с ним узоров в соседних объемах, что в свою очередь вызывает распространение специфического узора во все стороны по поверхности зоны коры. Элементами такого узора могут быть, например, дендритные сегменты (небольшие участки, ветки, дендритного дерева нейронов) по которым протекают соответствующие токи.

Особенность таких узоров – это однозначность соответствия кодов. То есть код, возникший в одном месте коры и вызвавший распространение узора, вызовет в другом месте коры вполне определенный узор. Этот узор будет уникален и будет соответствовать только той информации, что вызвала распространение исходной волны.

Любое место коры может выступать как приемником, так и передатчиком  информации. При этом информация распространяется широковещательно, то есть в пределах зоны коры может быть доступна на всей ее поверхности.

Система проекций между зонами коры состоит из пучков нервных волокон выходящих из небольших областей (порядка 300 мкм) и входящих в кору так же “точечно”. Можно предположить, что по проекционным пучкам происходит передача именно кодов, а не сигналов отдельных нейронов. Поступив на соответствующую зону коры далее сигнал распространяется широковещательно, то есть в виде разбегающегося узора (“шепота” дендритных сегментов).

Можно провести аналогию с тем, как для передачи в сети интернет на большие расстояния используются оптоволоконные кабели, которые выходят из определенного места и приходят в известную точку, а вот для раздачи сигнала всем абонентам используются беспроводные технологии типа lte или wi-fi.

Память – это результат интерференции информационных волн

Мы показали, что если создать в небольшом объеме коры последовательно два паттерна (узора) активности, то можно надежно зафиксировать память об этом событии. Речь идет не только об активности нейронов, но и о паттерне активности дендритных сегментов. Первый узор можно считать ключом, он укажет на то, какие дендритные сегменты должны  участвовать в запоминании. Второй узор – собственно информация. Он укажет на то, какую комбинацию активности должны зафиксировать выбранные сегменты.

С помощью такого механизма можно реализовать реляционную модель данных, позволяющую извлекать информацию обратно как по ключу, так и по значению.

Извлечение информации – это создание в локальной области соответствующего узора (кода), который далее может вызвать распространение информационной волны.

Миниколонки коры – пространство для запоминания

Расположенные друг под другом нейроны, имеющие преимущественные связи между собой, принято называть кортикальными миниколонками или модулями. В состав одной миниколонки входит порядка 100 нейронов (зависит от зоны коры).

Аксоны нейронов одной миниколонки густо переплетены и образуют плотную сеть из случайных множественных пересечений. В любом месте миниколонки поблизости всегда находится множество аксонов от разных нейронов. Аксоны ветвятся, образуя коллатерали, которые заканчиваются синапсами. В каждом месте миниколонки в пределах 1 мкм расположено порядка 30 синапсов, принадлежащих разным нейронам.

Когда часть нейронов миниколонки приходит в активность, формируя определенный код, в пространстве миниколонки происходит массовый выброс нейромедиаторов. Из синапсов за счет спиловера часть нейромедиаторов попадает в окружающее пространство.

Нейроны испускают не один нейромедиатор, а “коктейль” из нейромедиаторов и нейромодуляторов, кроме того, свои добавки вносят астроциты (концепция трехстороннего синапса). В результате, в тех местах, где пересекаются аксоны активных сейчас нейронов, будет формироваться специфический “коктейль”. При этом состав такого “коктейля” однозначно указывает на то, комбинация активности каких нейронов его вызвала. Разная активность – разный коктейль в разных местах. У каждого дендритного сегмента для любого сигнала всегда найдутся места с сильным пересечением активных нейронов и, соответственно, с богатым “коктейлем”. Память – это способность выбранных дендритных сегментов сохранить отпечаток того коктейля, что был связан с соответствующим сигналом.

Основа памяти – кластеры рецепторов на дендритной поверхности нейрона

Рецепторы, находящиеся в большом количестве на поверхности дендритов могут свободно перемещаться по мембране. Строение рецепторов позволяет им образовывать кластеры. На способности кластеров рецепторов настраиваться на определенные сочетания сигнальных веществ строится все взаимодействие клеток организма с окружающей средой. Можно предположить, что нейроны используют тот же механизм для создания кластеров, которые фиксируют на себе информацию об определенном “коктейле”, который присутствовал в момент запоминания и впоследствии позволяют откликаться на его повторение.

Очень похоже, что многообразие нейромедиаторов и их одновременное использование – это не прихоть природы, а механизм создания богатого разнообразия информационных ключей. При этом для “ключа” важен не только состав рецепторов, но и место где “ключ” расположен.

Гиппокамп – не промежуточная кладовая воспоминаний, а диспетчер, раздающий ярлыки

Для создания памяти требуется два узора. Один несет информацию, которую требуется сохранить, другой идентификатор (метку) этой информации. Мы полагаем, что гиппокамп не хранит воспоминаний. Его роль – создание уникальных идентификаторов воспоминаний. Эти идентификаторы распространяются на соответствующие зоны коры. Интерференция идентификаторов и информации приводит к формированию памяти непосредственно на месте, то есть в коре.

Для надежной фиксации памяти требуется, чтобы созданные под воспоминания кластеры рецепторов перешли в устойчивое состояние (прошли процессы адгезии и полимеризации). Не вся память которая создается (разговор о детальности воспоминаний) переходит в долговременное состояние. Процесс перехода в устойчивое состояние принято называть консолидацией памяти. Мы утверждаем, что это связано не с копированием памяти в гиппокамп и из гиппокампа, а с процессами изменения конформации рецепторов непосредственно в самой коре.

Так как для быстрого доступа к воспоминаниям удобно индексировать их по дате, месту, ключевым словам, то неудивительно, что в гиппокампе обнаружены структуры, отвечающие за все это. Похоже, что в свой идентификатор гиппокамп закладывает все, что может оказаться полезным для последующего поиска.

Основа понимания информации – это контекст и смысл

Излагая информацию, мы используем определенные системы понятий. Существуют системы, когда каждому термину приписывается единственно возможное значение. Очевидные примеры – математика и программирование. Это оказывается очень удобным для формулирования однозначно интерпретируемых утверждений. Однако такая система оказывается крайне громоздка и неудобна для быстрой передачи информации. Кроме того оказывается, что задача обобщения в такой системе решается только в ограниченном узком смысле.

В естественной речи человек использует более гибкую систему, в которой каждое используемое понятие имеет множество допустимых значений. Чтобы понять, какое значение уместно в конкретной ситуации, вводится понятие контекста. Для уточнения значения слова требуется указать контекст, в котором его надо понимать.

Контексты задают определенные сущности, в которых слова совместно и согласованно меняют свои значения.

Чтобы понять значение фразы, требуется взять все возможные контексты и посмотреть, как будет выглядеть эта фраза в каждом из контекстов. При этом надо заменить каждое из слов фразы на его трактовку в указанном контексте. Только в правильном контексте итоговая трактовка фразы, составленная из трактовок отдельных слов, окажется правдоподобной.

Определить правдоподобность трактовки можно единственным способом. Надо сравнить трактовку, полученную в контексте, со всем предыдущим опытом. То есть понять, не встречалась ли нам ранее такая или похожая на нее трактовка.

Предыдущий опыт – это память о всех пережитых событиях.  Память, составленная не из исходных описаний, а тех трактовок (интерпретаций), что мы им давали.

Важная особенность, что в каждом из контекстов сравнение полученной трактовки должно производиться с одной и той же “общей” памятью. Такой подход позволяет получить массу важнейших следствий, например, появляется возможность узнать явление, даже если мы никогда его не видели, но видели что-то аналогичное совсем в другом контексте.

Когда удается определить контекст или контексты, в которых трактовка информации приобретает правдоподобный вид, можно говорить о том, что найден смысл информации и то, как ее надо воспринимать (интерпретировать).

Описанное обобщает концепцию фреймов Марвина Минского, идеологию сверточных нейронных сетей и теорию формального анализа контекстов.

Мы показали, что любую информацию, с которой имеет дело мозг, можно описать через системы понятий и их контекстов. Принцип контекстов и определения смысла подходит как для визуальной и аудиальной, так и для тактильной, моторной и семантической информации.

Миниколонки коры – независимые процессоры контекстов

Мы считаем, что миниколонки, из которых состоит кора, – это независимые от других самостоятельные вычислительные модули. Каждая из миниколонок настраивается (обучается) на определенный контекст. Совокупность всех миниколонок одной зоны коры образует пространство всех возможных контекстов, которыми мы можем оперировать для того типа информации, на который зона коры специализирована.

Формирование контекста – это обучение правилам преобразования входного описания в его трактовку.

Работа зоны коры – это создание в каждой миниколонке своей трактовки одной и той же входной информации. Затем определение того, какие трактовки оказываются наделены смыслом.

Память не локализована и не распределена. Память тотальна

Для определения того, насколько трактовка приемлема, каждому контексту (миниколонке) требуется сверить то, насколько эта трактовка похожа на что-то уже содержащееся в памяти. Мы беремся утверждать, что, как это не удивительно, но каждая миниколонка коры содержит собственную полную копию всей памяти своей зоны коры, к которой она относится. Расчеты показывают, что механизм описанной ранее памяти, основанный на интерференции информационных волн, позволяет сохранить в одной миниколонке порядка полу-гигабайта семантической информации. Такой объем позволяет достаточно подробно хранить все воспоминания, накапливающиеся в течении человеческой жизни.

“Фактов не существует, есть только интерпретации фактов” (Фридрих Ницше). Поступающая информация лишена смысла до тех пор, пока не будет выбрана ее интерпретация. Пространство контекстов (зона коры) создает все доступные нам трактовки. Выбирается та трактовка или те трактовки, которые оказываются наиболее осмыслены. Затем, каждая из миниколонок преобразует входную информацию так, как видят ее “правильные” контексты и запоминает полученные “правильные” трактовки. За счет этого достигается постоянная синхронизация памяти всех миниколонок.

Миниколонки способны обучаться, обобщать и противостоять комбинаторному взрыву

При попытках провести любое обучение на информации, закодированной достаточно длинными кодами, мы сталкиваемся с так называемым проклятием размерности. Итерационное обучение, основанное на градиентном спуске оказывается сильно зависимым от начальных приближений и последовательности подачи данных. Даже огромное количество обучающих примеров не гарантирует нахождения “хороших” решений.

Наиболее удачное решение найдено в машинном обучении и основано на идее случайных подпространств. Имея бинарный вектор размерностью, например, 100 бит, мы получаем множество возможных состояний мощностью 2 в сотой степени. Это число многократно превышает количество элементарных частиц во вселенной. Предположим, что мы ищем закономерности в данных и знаем, что они описываются максимум 15 битами из 100. Создадим достаточно много подпространств, основанных на входных данных. Каждое из подпространств будет иметь дело не со всеми битами исходного вектора, а только с их ограниченным набором. Сами наборы создадим случайным образом. Сделаем размерность подпространств, например, 30 бит. Тогда при достаточном количестве подпространств для  любой закономерности с очень высокой вероятностью найдется хотя бы одно такое, в котором эта закономерность проявит себя в полном объеме. То есть, все или почти все биты, описывающие закономерность, окажутся в одном подпространстве. Это значит, что мы можем искать глобальные закономерности в локальных подпространствах, что сильно упрощает задачу. Число требуемых подпространств может составлять сотни тысяч, но сотни тысяч простых задач – это гораздо лучше, чем одна нерешаемая задача.

Одна миниколонка коры содержит порядка миллиона синапсов. С каждым синапсом в пределах досягаемости спилловера соседствует порядка трех десятков синапсов от разных нейронов. Каждый синапс можно рассматривать как случайное подпространство, в котором сходятся два-три десятка бит сигнала, образованного сотней нейронов миниколонки.

Мы описали и смоделировали механизм обучения и обобщения, построенный на создании при предъявлении примеров множества рецептивных кластеров, как гипотез о том, что определенное сочетание нейромедиаторов соответствует некой закономерности. Последующий опыт позволяет достаточно быстро проверить, действительно ли созданный кластер является закономерностью или он следствие случайного сочетания бит.

Контексты – это обобщения

Мы, в нашей концепции, описываем контексты, как наборы правил трактовки. Когда полученная в контексте трактовка оказывается похожа на то, что хранит память, то появляется возможность трактовать информацию в таком контексте. Правила трактовки формируются как опыт того, как меняется исходное описание в присутствии некого феномена, который и является контекстом. Изначально контекст формируется, исходя из некого характерного набора признаков, постепенно вычленяются закономерности трактовки, общие для явлений, объединенных этими общими признаками. В результате контекст получет способность узнавать явление не по каким-либо признакам, а по реализации “сути явления”.

Например, сначала мы видим столы у которых есть столешница и ножки. Мы создаем контекст “стол”. Постепенно мы обнаруживаем, что всем столам свойственно наличие поверхности, которая позволяет удобно оперировать предметами. Теперь мы относим к столам и пенек в лесу на который поставили корзинку, и операционный стол, и рабочий стол компьютера. Самое главное, что теперь мы способны узнать стол не по каким-либо признакам столов, может не быть ни одного ранее виденного признака стола, а по поведению других объектов. Если они ведут себя в процессе трактовки так, как если бы присутствовал стол, то мы в контексте “стола” получаем корректную трактовку и говорим, что обнаружили стол.

Любые понятия могут выступать контекстом. По-сути, пространство контекстов – это пространство доступных нам обобщений. Когда трактовка в каком-либо контексте оказывается удачной – это дает нам не только трактовку, но и сам контекст, как распознанный обобщенный признак.

Выбор оптимального описания – это мышление

Когда на какой-либо зоне коры возникает несколько контекстов и, соответственно, несколько связанных с ними трактовок, мы можем перечислить контексты и их трактовки и сказать, что это то, что мы “увидели” в поступившей информации. Но такой набор может оказаться перегружен излишними деталями и ненужными подробностями. Когда передо мной картина, на которой тысяча предметов я не могу себе позволить перечислять их все. Мы знаем, что краткость – сестра таланта. В общении мы ценим, когда собеседник может, убрав лишнее, изложить самую суть, оставив только то,что важно для пользы дела.

Мы считаем, что это не просто особенность речевого механизма, а фундаментальное свойство мышления. То есть каждая зона коры передает дальше не все трактовки и контексты, которые может определить, а только те, которые важны в данной ситуации для оптимального результата.

Поведение и мышление – результат обучения с подкреплением

Алгоритм оптимального выбора, позволяющий не следовать жестко заложенным правилам, а адаптироваться к особенностям окружающей среды, известен как обучение с подкреплением. Подкрепление (положительный или отрицательный опыт), полученное ранее, используется для того, чтобы в новых обстоятельствах выбрать действие, максимизирующее предстоящее подкрепление.

Можно утверждать, что и мышление и поведение формируется в результате обучения, основанного на опыте проб и ошибок.

Эмоциональные оценки – оценки качества ситуации

В обучении с подкреплением особую роль играет оценка качества ситуации. Подкрепление может быть сильно отложено по времени от момента совершения поступка или формирования мысли. Тогда можно оптимизировать не конкретное подкрепление, а вероятность получить подкрепление в будущем. Оценка вероятности будущего положительного или отрицательного подкрепления называется оценкой качества ситуации. Выбирая поступок, максимизирующий оценку качества ситуации, мы получаем алгоритм максимизирующий вероятность получения максимально возможного положительного подкрепления.

Что важно, что оценка качества ситуации сама может  выступать подкреплением. То есть, мы обучаемся максимизировать не только шансы на конкретный успех, но и шансы оказаться в ситуации, выгодной для последующего успеха.

Все эмоциональные оценки, выражающиеся в состояниях “хорошо” и “плохо”, есть оценки качества ситуации. Плохо – всегда страх чего-то неприятного. Хорошо – предвкушение чего-то положительного.

Пространство контекстов – механизм выбора оптимального прогноза

В классическом обучении с подкреплением строятся стратегии, позволяющие в знакомой ситуации поступить так, как предписывает ранее полученный опыт. Главная проблема – понять, что ситуации тождественны. При этом мы знаем, что иногда малейшая деталь полностью переворачивает смысл ситуации. Нельзя полагаться на определение сходства ситуаций, опираясь только на совпадение большинства признаков. Кроме того большинство ситуаций схожих по сути принципиально отличаются по своему исходному описанию.

Полноценное, свойственное человеку, решение задачи обучения с подкреплением возможно только с использованием пространства контекстов. Во-первых, оно позволяет узнавать явления и ситуации не по статистическому набору внешних признаков, а именно по сути происходящего. Во-вторых, в пространстве контекстов мы можем сопоставить ситуации, хранящиеся в памяти, даже если они происходили в разных контекстах, то есть, внешне совершенно непохожи друг на друга. Предательство всегда предательство независимо от формы, в которой оно выражается.

В пространстве миниколонок коры каждая миниколонка, которая оказалась способна дать осмысленную трактовку, на основе предыдущего опыта может вычислять свой прогноз оценки качества ситуации. Выбор оптимального выхода зоны коры – это выбор тех контекстов и трактовок, которые сулят наибольший прогноз оценки качества ситуации.

Например, при описании зрительной сцены мы должны выбрать в первую очередь те контексты, которые наиболее значимы. Этот выбор принято называть фокусом внимания. Итоговое описание, исходя из временных рамок работы коры, не должно превышать пяти – семи элементов описания. Это принято называть объемом внимания.

Выбор оптимального действия

Миниколонки способны обучаться преобразованию информации, то есть переводу одного описания в другое. Этот переход описания соответствует тому, как меняется информационная картина в присутствии понятия, соответствующего контексту. Для понятий, обозначающих действия, изменение описания – это создание описания, которое показывает, что будет после осуществления соответствующего действия. В общем случае – это крайне трудная задача, но она значительно упрощается, когда описания содержат только главный смысл информации и избавлены от малозначащих подробностей.

В таком подходе мозг позволяет реализовать модель обучения с подкреплением, использующую V-критика. Адаптивный V-критик требует наличие модуля модели мира, способного выполнять моделирование результатов предполагаемого действия и модуля, формирующего оценку качества ситуации для полученного описания. Перебрав все возможные действия стоит выбрать то, которое сулит максимальную оценку качества ситуации.

Пространство контекстов-действий позволяет смоделировать в виде лаконичных описаний результаты применения к текущему состоянию всех  возможных поступков. Память каждого из контекстов хранит опыт оценки ранее пережитых ситуаций. Это позволяет каждому из контекстов сформировать собственный прогноз оценки качества. В результате может быть выбран поступок, сулящий максимальную перспективу оценки качества. Кроме того может быть реализовано многошаговое прогнозирование.

Уверенность

При формировании прогноза оценки качества ситуации может быть получена не только сама оценка качества, но и оценка достоверности прогноза. Аналогично при определении смысла ситуации, может быть получена оценка уверенности в найденной аналогии. Оценка уверенности может использоваться в дальнейших информационных процессах. Так, например, при формировании поведения исследовательское поведение может быть получено при выборе высокого прогноза оценки при достаточно малой ее достоверности.

Миниколонки коры пространственно организованы оптимальным образом

Совершение выбора поступка или мыслеобразование требует выбора некоррелированных в некотором смысле между собой контекстов. Например, мы можем одновременно совершить действие рукой и ногой, но не можем одной рукой совершить два разных (пусть и выгодных) действия одновременно, нам следует выбрать из них одно самое оптимальное. Пространственная организация контекстов по принципу «похожее рядом» позволяет свести задачу выбора к поиску локальных максимумов на поверхности коры.

Кроме того, близкое пространственное расположение похожих по смыслу контекстов позволяет использовать код, создаваемый группой контекстов, как код обобщенного понятия. При этом коды близких понятий будут “похожи” друг на друга.