Все повседневные действия в мире людей воспроизведены в «Майнкрафте» 1:1. Цивилизация, состоящая из 100 миллиардов агентов искусственного интеллекта, на самом деле выглядит так.
Наконец-то раскрыта первая в мире «разумная цивилизация искусственного интеллекта»!
2 месяца назад более 1000 агентов сотрудничали в виртуальном мире, чтобы построить свою собственную экономику, культуру, религию и правительство...
Пользователи сети воскликнули, что это можно назвать реальной версией «Западного мира».
Теперь эта цивилизация снова развилась. На что похож мир с цивилизацией, состоящей из 100 миллиардов агентов искусственного интеллекта?
Они бывают индивидуумом и группой.
Все действия в повседневной жизни человека будут воспроизведены 1:1 в «Майнкрафте».
РОБЕРТ Янг, выпускник Пекинского университета, поделился последними исследованиями команды и впервые представил новую «когнитивную архитектуру», лежащую в основе PIANO.
PIANO (нейронная координация параллельного агрегирования информации) — это архитектура, которая позволяет агентам ИИ взаимодействовать с несколькими сторонами, сохраняя при этом согласованность в нескольких выходных потоках.
Адрес проекта: https://github.com/altera-al/project-sid
Как агент ИИ может думать и действовать одновременно, в нескольких временных масштабах, действуя как сознательно, так и подсознательно?
Как и клавиши фортепиано, они представляют собой разные модули мозга. Когда они играют вместе, они могут создавать красивые аккорды. В интеллектуальных агентах также вырабатываются человекоподобные качества.
Эти разумные агенты построят «цивилизацию». Налогообложение, торговля, правительство, страна, религия... вся повседневная деятельность в человеческом мире также включена в агенты ИИ.
Более того, агенты ИИ могут точно определять эмоции других, устанавливать дружеские отношения и даже наживать врагов. Некоторые агенты-интроверты, например люди-социофобы, имеют меньше социальных связей, чем агенты-экстраверты.
Некоторые пользователи сети сказали, что мы живем в матрице моделирования и будущее уже наступило.
Далее давайте взглянем на «мир» агентов ИИ. Какова общая картина?
Зачем нужна интеллектуальная цивилизация искусственного интеллекта?
Чтобы агенты ИИ могли сосуществовать с людьми и интегрироваться в наше общество, они должны быть не только автономными, но и способными к сотрудничеству.
В последние годы достижения в области больших языковых моделей (LLM) для рассуждений и принятия решений значительно повысили автономию агентов.
Однако просто иметь автономию недостаточно. Агенты также должны сосуществовать с людьми и другими агентами человеческой цивилизации.
Как сказал автор статьи:
Измерение цивилизационного прогресса по способности агентов сосуществовать и развивать нечеловеческие цивилизации представляет собой окончательный критерий возможностей агентов искусственного интеллекта.
Но построить цивилизацию искусственного интеллекта непросто.
Во-первых, агентам, использующим LLM, часто трудно сохранять ощущение реальности в своих действиях и рассуждениях.
Даже будучи оснащенными модулями планирования и размышления, агенты часто впадают в повторяющиеся модели поведения или накапливают ошибки в результате галлюцинаций, препятствуя значимому прогрессу.
Во-вторых, агенты, которые неправильно передают свои мысли и намерения, могут ввести в заблуждение других агентов, что приведет к дальнейшим галлюцинациям и петлям. Такое недопонимание часто происходит в группах агентов, что приводит к дисфункциональному поведению и ухудшению эффективности работы отдельных лиц в группе.
Наконец, текущий сравнительный анализ агентов фокусируется на производительности автономных агентов в различных областях, таких как веб-поиск, программирование, поиск и запросы, а также рассуждение.
Итак, каково оптимальное решение для создания ИИ-агента?
Новая архитектура ПИАНО
Для решения существующих проблем была создана новая архитектура PIANO.
Архитектура PIANO — это комплексная, очень гибкая среда разработки интеллектуальных агентов.
Среди них P представляет модуль восприятия, I представляет интеллектуальное ядро, а A — модуль действия. Одной из наиболее ярких особенностей архитектуры PIANO является то, что она позволяет агентам думать и действовать одновременно.
Эта функция снимает ограничения взаимных ограничений между действием и мышлением, которые могут существовать в традиционных архитектурах.
В сложных и постоянно меняющихся условиях агенты сталкиваются с различными ситуациями, включая непосредственные угрозы, требующие быстрого реагирования, а также продуманного долгосрочного планирования.
С точки зрения поведенческой когерентности введен модуль когнитивного контроллера (КК).
Модуль когнитивного контроллера (КК) представляет собой своего рода «мозговой центр» интеллектуального агента, отвечающий за принятие решений высокого уровня – получая и синтезируя информацию от каждого модуля, когнитивный контроллер преобразует эту информацию в единое и скоординированное решение. и далее преобразует его в соответствующий выходной сигнал в каждом модуле двигателя.
Это обеспечивает гармоничное сотрудничество между различными модулями и позволяет избежать несоответствий, вызванных независимой работой разных модулей.
Основываясь на двух вышеупомянутых архитектурных принципах, система архитектуры PIANO состоит из 10 различных модулей, которые работают одновременно. Ее основные модули включают в себя:
-память:
Модуль памяти можно назвать «сокровищницей мудрости» агента, будь то короткое ежедневное приветствие, углубленное техническое обсуждение или эмоциональное общение, каждое слово и каждое изменение тона точно сохраняется.
Кроме того, агент может запомнить не только описание каждого шага, но и вопросы, заданные в разговоре, порядок ответов и ключевые моменты, подчеркнутые обеими сторонами.
-Осознавание действий:
Это похоже на комплексную систему медицинского осмотра. С помощью этого модуля агент может точно определить собственный запас энергии и узнать, как долго оставшаяся мощность сможет поддерживать работу или достаточен ли запас топлива для выполнения следующего этапа задачи.
В то же время он может контролировать различные компоненты в режиме реального времени, например, определять, правильно ли работает датчик, гибкость механических соединений, скорость вычислений блока обработки данных и т. д. Ни одна крошечная аномалия не может ускользнуть от его «глаза».
-Целевая генерация:
Он основан на богатом опыте агента и глубоком взаимодействии с окружающей средой, постоянном выдвижении новых целей и подталкивании агента вперед.
Например, в сценарии логистики мультиагентного сотрудничества агент обнаруживает, что во время транспортировки груза на определенном участке часто возникают заторы (взаимодействие с окружающей средой), и ранее он участвовал в оптимизации маршрутов перевозки (прошлый опыт), тогда формируется цель Модуль может поставить новую цель: сотрудничать с другими агентами для разработки новой схемы транспортных маршрутов, позволяющей избежать перегруженных зон.
Этот механизм генерации целей дает агенту возможность активно исследовать и внедрять инновации, так что он не только пассивно выполняет заданные задачи, но и активно расширяет поле своего действия в соответствии с реальной ситуацией.
-Социальная осведомленность:
Это открывает возможность интеллектуальным агентам понять и интегрироваться в группу.
Простой для понимания, он может быстро реагировать на информацию о конкретных действиях.
Например, простой жест (поднятие руки может означать просьбу о помощи или привлечение внимания) или определенную позу тела (слегка наклон вперед может указывать на дружелюбие и внимание) модуль социальной осведомленности может точно распознать и понять его значение.
Конечно, если он распознает сигнал помощи от других агентов, он может решить, предоставлять ли помощь, исходя из своих собственных возможностей и текущей ситуации с задачей.
-диалог:
Диалоговый модуль является «языковым центром» интеллектуального агента и ключом к эффективному общению с внешним миром.
Модуль диалога обладает мощными возможностями синтаксического анализа и семантического понимания. Он может точно анализировать все типы получаемых языковых данных, будь то краткие и ясные инструкции, выражения эмоций или сложные и абстрактные концептуальные описания.
Более того, в случае расплывчатого или двусмысленного языка он также может делать разумные выводы на основе контекста и языковых привычек.
С точки зрения генерации языка модуль диалога может точно выражать свои мысли, исходя из внутреннего состояния и намерений агента.
-Навык исполнения:
Модуль реализации навыков является непосредственным исполнителем взаимодействия интеллектуального агента с внешней средой. Когда агенту необходимо выполнить определенный навык или действие в среде, модуль выполнения навыков упорядоченно координирует соответствующие части.
Одноагентно-мультиагентная эволюция
Взяв в качестве примера «Minecraft», исследователи выбрали 1000 предметов для оценки, пытаясь наблюдать и измерять прогресс разумной цивилизации.
одиночный агент
Во-первых, эффективность агента оценивается по тому, как он приобретает предметы в Minecraft.
Исследователи выставили 25 агентов, их рюкзаки вначале были пусты, а места, где они родились, находились далеко и они не могли общаться друг с другом. Все эти агенты были настроены исследовать и собирать предметы.
Они рождаются в разных местах, например, на поверхности, в пещерах, лесах и других средах. Разные точки появления означают, что у них разные ресурсы, а также разная сложность выполнения цели по сбору предметов.
Например, агент, рожденный на поверхности, где много ресурсов, может иметь много основных материалов, таких как дерево и камень, которые можно легко использовать для изготовления основных инструментов, но у агента, рожденного в пещере, может быть много таких материалов; минералы, но есть также тьма, монстры и т. д. Опасно, и вам придется исследовать окрестности, чтобы получить больше разных вещей.
Исследователи обнаружили, что после 30-минутной игры с агентом с полной архитектурой ПИАНО можно было получить в среднем 17 различных предметов. Однако их характеристики сильно различаются, в основном из-за различий в положении при рождении.
Некоторые агенты могут получить менее 5 предметов, в то время как наиболее эффективные агенты могут получить 30-40 предметов, что почти так же, как игроки-люди с некоторым опытом игры в «Minecraft».
Итак, каков верхний предел развития одного агента?
Исследователи обнаружили, что в тех же условиях они увеличили количество агентов до 49 и позволили им играть в течение четырех часов. После множества экспериментов выяснилось, что количество различных предметов, собираемых всеми агентами, стабилизировалось на уровне одной трети всех предметов в «Майнкрафте» (около 320 предметов).
мультиагентный
Мультиагент, как следует из названия, представляет собой группу нескольких агентов, которые могут взаимодействовать или конкурировать друг с другом в одной и той же среде.
Малые группы:
Чтобы агенты могли сотрудничать и развиваться в группе, они должны иметь возможность понимать действия и мысли других агентов. Эта способность понимать как себя, так и других позволяет агентам корректировать свое поведение в соответствии с ситуацией в социальной среде. .
Например, укрепляйте доверие при работе с союзниками и справляйтесь с конкуренцией и конфликтами, когда ладите с противниками. В результате экспериментов исследователи обнаружили, что агенты не только социально способны, но и могут формировать значимые социальные отношения в крупномасштабном моделировании с участием до 50 агентов.
Исследователи в основном изучали роль и сознание агента в группе посредством двух серий экспериментов.
-Могут ли социально осведомленные агенты делать выводы об эмоциях других людей в чате?
В чат-эксперименте между тремя персонажами и агентом в «Майнкрафте» можно увидеть, что когда персонажи в игре выражают эмоциональные изменения, такие как любовь-гнев-любовь, агент полностью способен понять эти эмоциональные изменения и сделать React соответственно.
-Может ли агент чувствовать эмоции и действовать соответственно?
В другом эксперименте о поведении агента судили по тому, насколько персонажу игры нравился или не нравился один и тот же агент. Исследователи обнаружили, что агент не только точно делал выводы о намерениях игрового персонажа, но и использовал намерения для их реализации. собственные решения при принятии решений.
общество:
Впоследствии исследователи поместили 50 агентов на случайно сгенерированную карту «Майнкрафт» и наделили каждого агента уникальной индивидуальностью. Они могут свободно перемещаться по этому миру и общаться с другими агентами по своему желанию.
В этом бесплатном сценарии исследователи обнаружили, что агент не только может точно оценивать роли других агентов, но и чем больше агентов участвует в этом суждении и чем дольше они общаются, тем точнее суждение.
Кроме того, в этом эксперименте исследователи также обнаружили несколько важных явлений:
-Важность социальных модулей:
Если социальный модуль удалить, отношения между агентами в это время будут относительно ровными, что показывает, что социальный модуль очень важен для развития долгосрочных отношений (независимо от того, хорошее это или плохое направление).
-Влияние личности на социальные сети:
Исследователи обнаружили, что некоторые агенты имели разные модели социальных связей в зависимости от их личности.
Например, агенты-интроверты получают значительно меньше связей, чем социальные агенты-экстраверты, что показывает, что личность также может отражаться в больших и сложных социальных сетях.
И хотя в большинстве случаев эмоции взаимны, это не всегда так. Агент может иметь положительное мнение о другом агенте, который его игнорирует, точно так же, как это происходит в реальном мире, где межличностные отношения сложны и не всегда взаимны.
Цивилизация рождается
После эволюции от одного агента к мультиагенту следующим шагом станет рождение цивилизации.
Чтобы оценить способность агентов продвигать цивилизацию, исследователи оценили, как они вели себя в нескольких ситуациях:
– Поведение агентов в рамках коллективных правил (с упором на соблюдение и пересмотр налогового законодательства)
– Изучите культурную коммуникацию посредством спонтанного создания мемов и структурированного общения отдельных религий.
Каждый выполняет свои обязанности и специализируется на разделении труда.
Именно специализированное разделение труда людей стимулирует прогресс цивилизации и способствует развитию сельского хозяйства, управления, культуры и технологий. Чтобы воспроизвести эти возникающие цивилизационные качества, агенты также должны обладать ими.
С этой целью автор предлагает три основных стандарта агентской специализации:
Во-первых, иметь автономию в выборе ролей и смене ролей. Во-вторых, их специализация должна быть продемонстрирована посредством взаимодействия и опыта, без четких указаний и ограничений. Наконец, выбранные ими роли должны отражаться в поведении, соответствующем их профессии.
Как показано на рисунке ниже, исследователи помещают интеллектуальных агентов в деревню, и они самостоятельно развивают разные профессии, например фермеров и инженеров.
Удаление социальной осведомленности приводит к тому, что агенты выбирают более однородные роли, которые не сохраняются с течением времени.
Ниже показано смоделированное распределение поведения 30 агентов в деревне.
Соблюдать налоговое законодательство, менять законодательство
Могут ли агенты ИИ создавать и изменять свои собственные законы?
Затем исследователи протестировали агента, внедрив налоговую систему. Выяснилось, что они не только соблюдали налоговое законодательство, но и демократически проголосовали за изменение налоговых ставок, исходя из общественного мнения.
Религиозное распространение варьируется от города к городу.
Наконец, могут ли агенты ИИ развивать свою собственную культуру?
Исследователи конкретно изучили органическое распространение мемов и проследили, как агенты сформировали вымышленную религию и распространились через ассоциации агентов.
Что еще более интересно, так это то, что в сельских районах и городах существуют разные культурные модели.
Выпускники Пекинского университета открывают бизнес по созданию чуткого искусственного интеллекта
Причина, по которой был запущен проект «Сид», заключается в том, что команда Altera AI надеется, что, исследуя эти проблемы, цифровые люди смогут в конечном итоге легко интегрироваться в человеческое общество.
Роберт Янг — соучредитель и генеральный директор Altera.
Ранее он получил степень доктора философии в области вычислительной нейробиологии в Нью-Йоркском и Йельском университетах, а также степень бакалавра физики в Пекинском университете.
Он был профессором кафедры мозговых и когнитивных наук и кафедры электротехники и информатики Массачусетского технологического института, а также руководителем группы MIT MetaConscious.
В 2023 году он закрыл свою лабораторию и оставил свою постоянную должность в Массачусетском технологическом институте, чтобы основать Altera.
Хотя команда Альтеры небольшая, плотность ее талантов чрезвычайно высока——
В его состав входят компьютерные нейробиологи, олимпийцы по физике и инженеры из факультета электротехники и информатики Массачусетского технологического института, Стэнфордской группы обработки естественного языка, Google X, Citadel, Supercell и других.
Эта компания, созданная более полугода назад, в начале года получила стартовое финансирование в размере 2 миллионов долларов США под руководством Андреессена Горовица.
Три месяца спустя компания привлекла еще 9 миллионов долларов под руководством First Spark Ventures бывшего генерального директора Google Эрика Шмидта, Patron VC, инвестора-ангела Митча Ласки и других.
В мае этого года Altera открыла филиал в Менло-Парке и намерена стать первым поставщиком интеллектуальных потребительских товаров.