Todas las actividades diarias del mundo humano se reproducen 1:1 en "Minecraft". Una civilización compuesta por 100 mil millones de agentes de IA en realidad se parece a esto.
¡Finalmente se ha revelado la primera “civilización inteligente con IA” del mundo!
Hace 2 meses, más de 1.000 agentes colaboraron en el mundo virtual para construir su propia economía, cultura, religión y gobierno...
Los internautas exclamaron que se le puede llamar una versión real del "Mundo Occidental".
Ahora, esta civilización ha vuelto a evolucionar. ¿Cómo es el mundo con una civilización de 100 mil millones de agentes de IA?
Son un individuo y un grupo.
Todas las actividades de la vida diaria humana se replicarán 1:1 en "Minecraft".
RoBERT Yang, alumno de la Universidad de Pekín, compartió las últimas investigaciones del equipo y presentó por primera vez la nueva "arquitectura cognitiva" detrás de PIANO.
PIANO (Coordinación neuronal de agregación de información paralela) es una arquitectura que permite a los agentes de IA interactuar con múltiples partes manteniendo la coherencia en múltiples flujos de salida.
Dirección del proyecto: https://github.com/altera-al/project-sid
¿Cómo puede un agente de IA pensar y actuar simultáneamente, en múltiples escalas de tiempo, operando tanto de manera consciente como subconsciente?
Al igual que las teclas de un piano, representan diferentes módulos cerebrales. Cuando se tocan juntos, pueden producir hermosos acordes. En los agentes inteligentes también se producen cualidades humanas.
Estos agentes inteligentes construirán una "civilización". Los agentes de IA también incluyen impuestos, comercio, gobierno, país, religión... todas las actividades diarias del mundo humano.
Además, los agentes de IA pueden inferir con precisión las emociones de los demás, entablar amistades e incluso crear enemigos. Algunos agentes introvertidos, como los humanos sociófobos, tienen menos conexiones sociales que los agentes extrovertidos.
Algunos internautas dijeron que vivimos en una matriz de simulación y que el futuro es ahora.
A continuación, echemos un vistazo al “mundo” de los agentes de IA. ¿Cuál es el panorama general?
¿Por qué se necesita una civilización inteligente con IA?
Para que los agentes de IA coexistan con los humanos y se integren en nuestra sociedad, no solo deben ser autónomos sino también capaces de colaborar.
En los últimos años, los avances en los modelos de lenguaje grande (LLM) para el razonamiento y la toma de decisiones han mejorado significativamente la autonomía de los agentes.
Sin embargo, no basta con tener autonomía. Los agentes también deben coexistir con los humanos y otros agentes de la civilización humana.
Como dijo el autor del artículo:
Medir el progreso de la civilización por la capacidad de los agentes para coexistir y hacer avanzar civilizaciones no humanas representa el punto de referencia definitivo para las capacidades de los agentes de inteligencia artificial.
Pero construir una civilización de IA no es fácil.
En primer lugar, los agentes que realizan un LLM a menudo tienen dificultades para mantener un sentido de realidad en sus acciones y razonamientos.
Incluso cuando están equipados con módulos de planificación y reflexión, los agentes a menudo caen en patrones de comportamiento repetitivos o acumulan errores a través de alucinaciones, lo que impide un progreso significativo.
En segundo lugar, los agentes que comunican mal sus pensamientos e intenciones pueden engañar a otros agentes, provocando más alucinaciones y bucles. Esta falta de comunicación suele ocurrir en grupos de agentes, lo que conduce a un comportamiento disfuncional y empeora el desempeño de los individuos del grupo.
Finalmente, la evaluación comparativa actual de agentes se centra en el desempeño de agentes autónomos en diversos dominios, como la búsqueda web, la programación, la búsqueda y consulta y el razonamiento.
Entonces, ¿cuál es la solución óptima para crear un agente de IA?
Nueva arquitectura PIANO
Para resolver los problemas existentes, surgió la nueva arquitectura PIANO.
La arquitectura PIANO es un marco de diseño de agentes inteligentes integral y altamente flexible.
Entre ellos, P representa el módulo de percepción, I representa el núcleo inteligente y A es el módulo de acción. Una de las características más llamativas de la arquitectura PIANO es que permite a los agentes pensar y actuar simultáneamente.
Esta característica rompe las limitaciones de las restricciones mutuas entre acción y pensamiento que pueden existir en las arquitecturas tradicionales.
En entornos complejos y en constante cambio, los agentes enfrentan una variedad de situaciones, incluidas amenazas inmediatas que requieren una respuesta rápida, así como una planificación bien pensada a largo plazo.
En términos de coherencia conductual, se introduce el módulo de controlador cognitivo (CC).
El módulo de controlador cognitivo (CC) es como el "centro cerebral" del agente inteligente, responsable de tomar decisiones de alto nivel: al recibir y sintetizar información de cada módulo, el controlador cognitivo transforma esta información en una decisión unificada y coordinada. y además lo convierte en la salida apropiada en cada módulo de motor.
Garantiza una colaboración armoniosa entre varios módulos y evita las inconsistencias causadas por diferentes módulos trabajando de forma independiente.
Basado en los dos principios arquitectónicos anteriores, el sistema de arquitectura PIANO consta de 10 módulos diferentes que se ejecutan simultáneamente. Sus módulos principales incluyen:
-memoria:
El módulo de memoria puede denominarse el "tesoro de la sabiduría" del agente, ya sea un breve saludo diario, una discusión técnica en profundidad o una comunicación emocional, cada palabra y cada cambio de tono se almacena con precisión.
Además, el agente no sólo puede recordar la descripción de cada paso, sino también las preguntas formuladas en la conversación, el orden de las respuestas y los puntos clave enfatizados por ambas partes.
-Conciencia de acción:
Es como un sistema de examen físico integral. A través de este módulo, el agente puede captar con precisión su propia reserva de energía y saber durante cuánto tiempo la energía restante puede soportar la operación, o si la reserva de combustible es suficiente para completar la siguiente etapa de la tarea.
Al mismo tiempo, puede monitorear varios componentes en tiempo real, como detectar si el sensor funciona correctamente, la flexibilidad de las juntas mecánicas, la velocidad de cálculo de la unidad de procesamiento de datos, etc. Ninguna pequeña anomalía puede escapar a sus "ojos".
-Generación objetivo:
Se basa en la rica experiencia del agente y la interacción profunda con el entorno, fomentando constantemente nuevos objetivos e impulsando al agente hacia adelante.
Por ejemplo, en un escenario logístico de cooperación de múltiples agentes, el agente descubre que a menudo ocurre congestión en un área determinada durante el transporte de carga (interacción ambiental) y ha participado previamente en la optimización de las rutas de transporte (experiencia pasada), entonces se genera el objetivo. El módulo puede generar un nuevo objetivo: colaborar con otros agentes para diseñar un nuevo esquema de rutas de transporte que evite zonas congestionadas.
Este mecanismo de generación de objetivos le da al agente la capacidad de explorar e innovar activamente, de modo que no solo realiza pasivamente tareas preestablecidas, sino que también expande activamente su campo de acción de acuerdo con la situación real.
-Conciencia social:
Abre la puerta para que los agentes inteligentes comprendan e integren el grupo.
Fácil de entender, puede responder rápidamente a información de acción específica.
Por ejemplo, un gesto simple (levantar un brazo puede significar pedir ayuda o llamar la atención), o una postura corporal específica (inclinarse ligeramente hacia adelante puede indicar amabilidad y atención), el módulo de conciencia social puede reconocer y comprender con precisión su significado.
Por supuesto, si reconoce la señal de ayuda de otros agentes, puede decidir si proporciona ayuda en función de sus propias capacidades y la situación de la tarea actual.
-diálogo:
El módulo de diálogo es el "centro lingüístico" del agente inteligente y la clave para una comunicación eficaz con el mundo exterior.
El módulo de diálogo tiene potentes capacidades de análisis de sintaxis y comprensión semántica. Puede analizar con precisión todo tipo de entradas de lenguaje que recibe, ya sean instrucciones claras y concisas, expresiones emocionales o descripciones conceptuales complejas y abstractas.
Además, en el caso de un lenguaje vago o ambiguo, también se pueden hacer inferencias razonables basadas en el contexto y los hábitos lingüísticos.
En términos de generación de lenguaje, el módulo de diálogo puede expresar con precisión sus pensamientos en función del estado interno y las intenciones del agente.
-Ejecución de habilidades:
El módulo de ejecución de habilidades es el ejecutor directo de la interacción entre el agente inteligente y el entorno externo. Cuando el agente necesita realizar una habilidad o acción específica en el entorno, el módulo de ejecución de habilidades coordina las partes relevantes de manera ordenada.
Evolución agente único-multiagente
Tomando "Minecraft" como ejemplo, los investigadores seleccionaron 1.000 elementos para evaluarlos en un intento de observar y medir el progreso de la civilización inteligente.
agente único
Primero, el desempeño del agente se evalúa según cómo adquiere elementos en Minecraft.
Los investigadores establecieron 25 agentes. Sus mochilas estaban vacías al principio, y los lugares donde nacieron estaban muy lejos y no podían comunicarse entre sí. Todos estos agentes estaban listos para explorar y recolectar elementos.
Nacen en diferentes lugares, como la superficie, cuevas, bosques u otros ambientes diferentes. Los diferentes puntos de generación significan que tienen diferentes recursos y la dificultad para completar el objetivo de recolectar elementos también es diferente.
Por ejemplo, un agente nacido en la superficie donde hay muchos recursos puede tener muchos materiales básicos, como madera y piedra, que pueden usarse fácilmente para fabricar herramientas básicas, pero un agente nacido en una cueva puede tener muchos; minerales, pero también hay oscuridad, monstruos, etc. Peligrosos, y tienes que explorar el exterior para conseguir más tipos de cosas.
Los investigadores descubrieron que después de jugar durante 30 minutos con un agente con una arquitectura PIANO completa, se podía obtener un promedio de 17 elementos diferentes. Sin embargo, su rendimiento varía mucho, principalmente debido a diferencias en la posición al nacer.
Algunos agentes solo pueden obtener menos de 5 elementos, mientras que los agentes con mejor desempeño pueden obtener entre 30 y 40 elementos, lo que es casi lo mismo que los jugadores humanos con cierta experiencia en "Minecraft".
Entonces, ¿cuál es el límite superior del desarrollo de un único agente?
Los investigadores descubrieron que, en las mismas condiciones, aumentaron el número de agentes a 49 y los dejaron jugar durante cuatro horas. Después de muchos experimentos, se descubrió que el número de elementos diferentes recolectados por todos los agentes se ha estabilizado en un tercio de todos los elementos en "Minecraft" (alrededor de 320 elementos).
multiagente
Multiagente, como su nombre indica, es un grupo de múltiples agentes que pueden comunicarse o competir entre sí en el mismo entorno.
Grupos pequeños:
Para que los agentes cooperen y se desarrollen en un grupo, deben poder comprender las acciones y pensamientos de otros agentes. Esta capacidad de comprenderse a sí mismos y a los demás les permite ajustar su comportamiento de acuerdo con la situación en un entorno social. .
Por ejemplo, genere confianza cuando trabaje con aliados y enfrente la competencia y el conflicto cuando se lleve bien con los oponentes. Los investigadores descubrieron a través de experimentos que los agentes no sólo son socialmente capaces sino que también pueden formar relaciones sociales significativas en simulaciones a gran escala de hasta 50 agentes.
Los investigadores estudiaron principalmente el papel y la conciencia del agente en el grupo a través de dos series de experimentos.
-¿Pueden los agentes con conciencia social inferir las emociones de otras personas a través del chat?
En el experimento de chat entre tres personajes y el agente en "Minecraft", se puede ver que cuando los personajes del juego expresan cambios emocionales como amor-ira-amor, el agente es completamente capaz de comprender estos cambios emocionales y reaccionar. respectivamente.
-¿Puede el agente sentir emociones y actuar en consecuencia?
En otro experimento, el comportamiento de un agente se infirió en función de cuánto le gustaba o no le gustaba al personaje del juego. Los investigadores descubrieron que el agente no sólo infería con precisión las intenciones del personaje del juego, sino que también las utilizaba para expresar sus intenciones. propias decisiones a la hora de tomar decisiones.
sociedad:
Posteriormente, los investigadores colocaron 50 agentes en un mapa generado aleatoriamente de "Minecraft" y le dieron a cada agente una personalidad única. Pueden moverse libremente en este mundo y comunicarse con otros agentes a voluntad.
En este escenario libre, los investigadores descubrieron que el agente no sólo podía juzgar con precisión los roles de otros agentes, sino que cuanto más agentes participaban en el juicio y más tiempo se comunicaban, más preciso era el juicio.
Además, en este experimento, los investigadores también descubrieron varios fenómenos importantes:
-La importancia de los módulos sociales:
Si se elimina el módulo social, la relación entre los agentes será relativamente plana en este momento, lo que demuestra que el módulo social es muy importante para el desarrollo de relaciones a largo plazo (ya sea en una buena o mala dirección).
-El impacto de la personalidad en las redes sociales:
Los investigadores encontraron que algunos agentes tenían diferentes patrones de conexión social según sus personalidades.
Por ejemplo, los agentes introvertidos reciben significativamente menos conexiones que los agentes sociales extrovertidos, lo que demuestra que la personalidad también puede reflejarse en redes sociales grandes y complejas.
Y, aunque la mayoría de las veces las emociones son mutuas, no siempre es así. Un agente puede tener una opinión favorable de otro agente que lo ignora, tal como ocurre en el mundo real donde las relaciones interpersonales son complejas y no siempre mutuas.
Nace la civilización
Después de la evolución de agente único a agente múltiple, el siguiente paso es el nacimiento de la civilización.
Para evaluar la capacidad de los agentes para hacer avanzar la civilización, los investigadores evaluaron cómo se comportaban en varias situaciones:
– Comportamiento de los agentes bajo reglas colectivas (centrándose en el cumplimiento y revisión de las leyes tributarias)
– Explorar la comunicación cultural a través de la generación espontánea de memes y la comunicación estructurada de religiones individuales.
Cada uno desempeña sus funciones y se especializa en la división del trabajo.
Es la división especializada del trabajo de los seres humanos la que impulsa el progreso de la civilización y promueve el avance de la agricultura, la gobernanza, la cultura y la tecnología. Para replicar estas cualidades civilizacionales emergentes, los agentes también deberían poseerlas.
Para ello, el autor propone tres estándares básicos para la especialización de agentes:
Primero, tener autonomía en la selección y transición de roles. En segundo lugar, su especialización debe demostrarse a través de la interacción y la experiencia, sin direcciones ni limitaciones claras. Finalmente, los roles que elijan deben reflejarse en comportamientos acordes con su profesión.
Como se muestra en la figura siguiente, los investigadores colocan agentes inteligentes en una aldea y estos desarrollarán diferentes profesiones por su cuenta, como agricultores e ingenieros.
La eliminación de la conciencia social lleva a que los agentes elijan roles más homogéneos que no persisten en el tiempo.
La siguiente es la distribución simulada del comportamiento de 30 agentes en una aldea.
Cumplir con las leyes fiscales, cambiar las leyes.
¿Pueden los agentes de IA crear y modificar sus propias leyes?
A continuación, los investigadores probaron el agente implementando un sistema fiscal. Se descubrió que no sólo cumplían con las leyes fiscales sino que también votaban democráticamente para cambiar las tasas impositivas basándose en el sentimiento público.
La difusión religiosa varía de una ciudad a otra
Finalmente, ¿pueden los agentes de IA desarrollar su propia cultura?
Los investigadores observaron específicamente la difusión orgánica de los memes y rastrearon cómo los agentes formaron una religión ficticia y se propagaron a través de asociaciones de agentes.
Lo que es aún más interesante es que las zonas rurales y las ciudades presentan patrones culturales diferentes.
Exalumnos de la Universidad de Pekín inician un negocio para desarrollar una IA empática
La razón por la que se lanzó el Proyecto Sid es porque el equipo de Altera AI espera que, al explorar estos temas, los humanos digitales puedan, en última instancia, integrarse perfectamente en la sociedad humana.
Robert Yang es el cofundador y director ejecutivo de Altera.
Anteriormente, obtuvo un doctorado en neurociencia computacional de la Universidad de Nueva York y la Universidad de Yale, y una licenciatura en física de la Universidad de Pekín.
Fue profesor en el Departamento de Ciencias Cognitivas y del Cerebro y en el Departamento de Ingeniería Eléctrica e Informática del MIT, y líder del grupo MetaConscious del MIT.
En 2023, cerró su laboratorio y dejó su puesto permanente en el MIT para fundar Altera.
Aunque el equipo de Altera es pequeño, su densidad de talento es extremadamente alta——
Está compuesto por neurocientíficos computacionales, físicos olímpicos e ingenieros del Departamento de Ingeniería Eléctrica y Ciencias de la Computación del MIT, el Grupo de Procesamiento del Lenguaje Natural de Stanford, Google X, Citadel, Supercell y más.
Esta empresa, fundada hace más de medio año, recibió a principios de año 2 millones de dólares en financiación inicial, liderada por Andreessen Horowitz.
Tres meses después, recaudó otros 9 millones de dólares, liderados por First Spark Ventures del ex director ejecutivo de Google, Eric Schmidt, Patron VC, el inversor ángel Mitch Lasky y otros.
En mayo de este año, Altera abrió una sucursal en Menlo Park y se compromete a convertirse en el primer proveedor de productos de consumo inteligentes.