Todas as atividades diárias do mundo humano são reproduzidas 1:1 no "Minecraft". Uma civilização composta por 100 bilhões de agentes de IA realmente se parece com isto.
A primeira “civilização inteligente de IA” do mundo foi finalmente revelada!
Há 2 meses, mais de 1.000 agentes colaboraram no mundo virtual para construir sua própria economia, cultura, religião e governo...
Os internautas exclamaram que isso pode ser chamado de versão da vida real do “Mundo Ocidental”.
Agora, esta civilização evoluiu novamente. Como é o mundo com uma civilização de 100 mil milhões de agentes de IA?
Eles são um indivíduo e um grupo.
Todas as atividades da vida diária humana serão replicadas 1:1 no "Minecraft".
RoBERT Yang, ex-aluno da Universidade de Pequim, compartilhou as pesquisas mais recentes da equipe e apresentou pela primeira vez a nova “arquitetura cognitiva” por trás do PIANO.
PIANO (Coordenação Neural de Agregação de Informações Paralelas) é uma arquitetura que permite que agentes de IA interajam com várias partes, mantendo a coerência em vários fluxos de saída.
Endereço do projeto: https://github.com/altera-al/project-sid
Como pode um agente de IA pensar e agir simultaneamente, em múltiplas escalas de tempo, operando tanto de forma consciente como subconsciente?
Assim como as teclas de um piano, elas representam diferentes módulos cerebrais. Quando tocados juntos, eles podem produzir belos acordes. Nos agentes inteligentes, também são produzidas qualidades semelhantes às humanas.
Estes agentes inteligentes construirão uma “civilização”. Tributação, comércio, governo, país, religião... todas as atividades diárias no mundo humano também estão incluídas nos agentes de IA.
Além disso, os agentes de IA podem inferir com precisão as emoções dos outros, estabelecer amizades e até mesmo fazer inimigos. Alguns agentes introvertidos, como os humanos sociofóbicos, têm menos conexões sociais do que os agentes extrovertidos.
Alguns internautas disseram que vivemos numa matriz de simulação e o futuro é agora.
A seguir, vamos dar uma olhada no “mundo” dos agentes de IA. Qual é o quadro geral?
Por que a civilização inteligente da IA é necessária?
Para que os agentes de IA coexistam com os humanos e se integrem na nossa sociedade, eles precisam ser não apenas autônomos, mas também capazes de colaborar.
Nos últimos anos, os avanços nos grandes modelos de linguagem (LLMs) para raciocínio e tomada de decisão aumentaram significativamente a autonomia dos agentes.
Porém, simplesmente ter autonomia não é suficiente. Os agentes também devem coexistir com os humanos e outros agentes da civilização humana.
Como disse o autor do artigo:
Medir o progresso civilizacional pela capacidade dos agentes de coexistirem e promoverem civilizações não humanas representa a referência definitiva para as capacidades dos agentes de inteligência artificial.
Mas construir uma civilização de IA não é fácil.
Primeiro, os agentes baseados no LLM muitas vezes têm dificuldade em manter um sentido de realidade nas suas acções e raciocínios.
Mesmo quando equipados com módulos de planeamento e reflexão, os agentes muitas vezes caem em padrões de comportamento repetitivos ou acumulam erros através de alucinações, impedindo um progresso significativo.
Em segundo lugar, os agentes que comunicam mal os seus pensamentos e intenções podem enganar outros agentes, levando a mais alucinações e ciclos. Essa falta de comunicação ocorre frequentemente em grupos de agentes, levando a comportamentos disfuncionais e piorando o desempenho dos indivíduos do grupo.
Finalmente, o benchmarking atual de agentes concentra-se no desempenho de agentes autônomos em vários domínios, como pesquisa na web, programação, pesquisa e consulta e raciocínio.
Então, qual é a solução ideal para construir um agente de IA?
Nova arquitetura PIANO
Para resolver os problemas existentes, surgiu a nova arquitetura PIANO.
A arquitetura PIANO é uma estrutura de design de agente inteligente abrangente e altamente flexível.
Entre eles, P representa o módulo de percepção, I representa o núcleo inteligente e A é o módulo de ação. Uma das características mais marcantes da arquitetura PIANO é que ela permite que os agentes pensem e ajam simultaneamente.
Esta característica quebra as limitações das restrições mútuas entre ação e pensamento que podem existir nas arquiteturas tradicionais.
Em ambientes complexos e em constante mudança, os agentes enfrentam uma variedade de situações, incluindo ameaças imediatas que exigem uma resposta rápida, bem como um planeamento cuidadoso a longo prazo.
Em termos de coerência comportamental, é introduzido o módulo do controlador cognitivo (CC).
O módulo controlador cognitivo (CC) é como o “centro cerebral” do agente inteligente, responsável pela tomada de decisões de alto nível – ao receber e sintetizar informações de cada módulo, o controlador cognitivo transforma essas informações em uma decisão unificada e coordenada. e ainda o converte na saída apropriada em cada módulo do motor.
Garante uma colaboração harmoniosa entre vários módulos e evita inconsistências causadas por diferentes módulos trabalhando de forma independente.
Com base nos dois princípios arquitetônicos acima, o sistema de arquitetura PIANO consiste em 10 módulos diferentes que são executados simultaneamente. Seus módulos principais incluem:
-memória:
O módulo de memória pode ser chamado de “tesouro de sabedoria” do agente. Seja uma breve saudação diária, uma discussão técnica aprofundada ou uma comunicação emocional, cada palavra e cada mudança de tom são armazenadas com precisão.
Além disso, o agente consegue lembrar não apenas a descrição de cada etapa, mas também as perguntas feitas na conversa, a ordem das respostas e os pontos-chave enfatizados por ambas as partes.
-Consciência de ação:
É como um sistema abrangente de exame físico. Através deste módulo, o agente pode compreender com precisão a sua própria reserva de energia e saber por quanto tempo a energia restante pode suportar a operação, ou se a reserva de combustível é suficiente para completar a próxima etapa da tarefa.
Ao mesmo tempo, pode monitorar vários componentes em tempo real, como detectar se o sensor está funcionando corretamente, a flexibilidade das juntas mecânicas, a velocidade de computação da unidade de processamento de dados, etc. Nenhuma pequena anormalidade pode escapar dos seus “olhos”.
-Geração de alvo:
Baseia-se na rica experiência do agente e na profunda interação com o meio ambiente, nutrindo constantemente novos objetivos e impulsionando o agente para frente.
Por exemplo, em um cenário logístico de cooperação multiagente, o agente descobre que frequentemente ocorre congestionamento em uma determinada área durante o transporte de carga (interação ambiental) e já participou anteriormente da otimização das rotas de transporte (experiência anterior), então a meta é gerada O módulo pode gerar um novo objetivo: colaborar com outros agentes para desenhar um novo esquema de rotas de transporte que evite áreas congestionadas.
Este mecanismo de geração de metas dá ao agente a capacidade de explorar e inovar ativamente, de modo que não apenas execute passivamente tarefas pré-definidas, mas também expanda ativamente seu campo de ação de acordo com a situação real.
-Consciência social:
Isso abre a porta para que agentes inteligentes entendam e se integrem ao grupo.
Simples de entender, ele pode responder rapidamente a informações de ações específicas.
Por exemplo, um simples gesto (levantar um braço pode significar pedir ajuda ou atrair atenção), ou uma postura corporal específica (inclinar-se ligeiramente para a frente pode indicar simpatia e atenção), o módulo de consciência social pode reconhecer e compreender com precisão o seu significado.
É claro que, se reconhecer o sinal de ajuda de outros agentes, poderá decidir se deve fornecer ajuda com base nas suas próprias capacidades e na situação atual da tarefa.
-diálogo:
O módulo de diálogo é o “centro de linguagem” do agente inteligente e a chave para uma comunicação eficaz com o mundo exterior.
O módulo de diálogo possui poderosas capacidades de análise de sintaxe e compreensão semântica. Ele pode analisar com precisão todos os tipos de informações linguísticas que recebe, sejam instruções concisas e claras, expressões emocionais ou descrições conceituais complexas e abstratas.
Além disso, para linguagem vaga ou ambígua, também pode fazer inferências razoáveis com base no contexto e nos hábitos linguísticos.
Em termos de geração de linguagem, o módulo de diálogo pode expressar com precisão os seus pensamentos com base no estado interno e nas intenções do agente.
-Execução de habilidades:
O módulo de execução de habilidades é o executor direto da interação entre o agente inteligente e o ambiente externo. Quando o agente precisa realizar uma habilidade ou ação específica no ambiente, o módulo de execução de habilidades coordena as partes relevantes de maneira ordenada.
Evolução agente único-multiagente
Tomando o “Minecraft” como exemplo, os pesquisadores selecionaram 1.000 itens para avaliação na tentativa de observar e medir o progresso da civilização inteligente.
agente único
Primeiramente, o desempenho do agente é avaliado pela forma como ele adquire itens no Minecraft.
Os pesquisadores montaram 25 agentes. Suas mochilas estavam vazias no início, os locais onde nasceram eram distantes e eles não conseguiam se comunicar entre si. Esses agentes estavam todos preparados para explorar e coletar itens.
Eles nascem em locais diferentes, como a superfície, cavernas, florestas ou outros ambientes diversos. Diferentes pontos de spawn significam que eles possuem recursos diferentes, e a dificuldade de completar o objetivo de coletar itens também é diferente.
Por exemplo, um agente nascido na superfície onde existem muitos recursos pode ter muitos materiais básicos, como madeira e pedra, que podem ser facilmente usados para fazer ferramentas básicas, mas um agente nascido em uma caverna pode ter muitos; minerais, mas também existem trevas, monstros, etc. Perigosos, e você tem que explorar o exterior para conseguir mais tipos de coisas.
Os pesquisadores descobriram que depois de tocar por 30 minutos com um agente com arquitetura PIANO completa, era possível obter em média 17 itens diferentes. Porém, seu desempenho varia muito, principalmente devido às diferenças na posição de nascimento.
Alguns agentes só podem obter menos de 5 itens, enquanto os agentes com melhor desempenho podem obter de 30 a 40 itens, o que é quase o mesmo que jogadores humanos com alguma experiência em "Minecraft".
Então, qual é o limite superior do desenvolvimento de um único agente?
Os pesquisadores descobriram que, nas mesmas condições, aumentaram o número de agentes para 49 e os deixaram jogar por quatro horas. Depois de muitos experimentos, descobriu-se que o número de itens diferentes coletados por todos os agentes se estabilizou em um terço de todos os itens do "Minecraft" (cerca de 320 itens).
multiagente
Multiagente, como o nome sugere, é um grupo de múltiplos agentes que podem se comunicar ou competir entre si no mesmo ambiente.
Pequenos grupos:
Para que os agentes cooperem e se desenvolvam em grupo, eles devem ser capazes de compreender as ações e pensamentos de outros agentes. Essa capacidade de compreender a si mesmos e aos outros permite que os agentes ajustem seu comportamento de acordo com a situação em um ambiente social. .
Por exemplo, construa confiança ao trabalhar com aliados e lide com a competição e o conflito ao conviver com os oponentes. Os investigadores descobriram através de experiências que os agentes não são apenas socialmente capazes, mas podem formar relações sociais significativas em simulações em grande escala de até 50 agentes.
Os pesquisadores estudaram principalmente o papel e a consciência do agente no grupo por meio de dois conjuntos de experimentos.
-Os agentes socialmente conscientes podem inferir as emoções de outras pessoas através do bate-papo?
No experimento de chat entre três personagens e o agente no “Minecraft”, pode-se perceber que quando os personagens do jogo expressam mudanças emocionais como amor-raiva-amor, o agente é totalmente capaz de compreender essas mudanças emocionais e fazer React de acordo.
-O agente consegue sentir emoções e agir de acordo?
Em outro experimento, o comportamento de um agente foi inferido pelo quanto o personagem no jogo gostava ou não do mesmo agente. Os pesquisadores descobriram que o agente não apenas inferiu com precisão as intenções do personagem do jogo, mas também usou as intenções para fazer suas intenções. próprias decisões ao tomar decisões.
sociedade:
Posteriormente, os pesquisadores colocaram 50 agentes em um mapa de "Minecraft" gerado aleatoriamente e deram a cada agente uma personalidade única. Eles podem se mover livremente neste mundo e se comunicar com outros agentes à vontade.
Neste cenário livre, os investigadores descobriram que não só o agente poderia julgar com precisão os papéis de outros agentes, mas quanto mais agentes envolvidos no julgamento e quanto mais tempo comunicassem, mais preciso seria o julgamento.
Além disso, neste experimento, os pesquisadores também descobriram vários fenômenos importantes:
-A importância dos módulos sociais:
Se o módulo social for retirado, a relação entre os agentes ficará relativamente plana neste momento, o que mostra que o módulo social é muito importante para o desenvolvimento de relacionamentos de longo prazo (seja uma direção boa ou ruim).
-O impacto da personalidade nas redes sociais:
Os pesquisadores descobriram que alguns agentes tinham diferentes padrões de conexão social com base em suas personalidades.
Por exemplo, os agentes introvertidos recebem significativamente menos ligações do que os agentes sociais extrovertidos, o que mostra que a personalidade também pode ser reflectida em redes sociais grandes e complexas.
E, embora na maioria das vezes as emoções sejam mútuas, nem sempre é assim. Um agente pode ter uma opinião favorável de outro agente que a ignora, tal como acontece no mundo real onde as relações interpessoais são complexas e nem sempre mútuas.
Nasce a civilização
Após a evolução de agente único para multiagente, o próximo passo é o nascimento da civilização.
Para avaliar a capacidade dos agentes de avançar a civilização, os pesquisadores avaliaram como eles se comportavam em diversas situações:
– Comportamento dos agentes sob regras coletivas (com foco no cumprimento e revisão da legislação tributária)
– Explorar a comunicação cultural através da geração espontânea de memes e da comunicação estruturada de religiões únicas
Cada um desempenha suas funções e é especializado na divisão do trabalho
É a divisão especializada do trabalho dos seres humanos que impulsiona o progresso da civilização e promove o avanço da agricultura, da governação, da cultura e da tecnologia. Para replicar estas qualidades civilizacionais emergentes, os agentes também deveriam possuí-las.
Para tanto, o autor propõe três padrões básicos para a especialização de agentes:
Primeiro, tenha autonomia na seleção e transição de funções. Em segundo lugar, a sua especialização deve ser demonstrada através da interação e da experiência, sem orientações e limitações claras. Finalmente, os papéis que escolhem devem reflectir-se em comportamentos consistentes com a sua profissão.
Conforme mostrado na figura abaixo, os pesquisadores colocam agentes inteligentes em uma aldeia, e eles desenvolverão diferentes profissões por conta própria, como agricultores e engenheiros.
A remoção da consciência social leva os agentes a escolherem papéis mais homogéneos que não persistem ao longo do tempo.
A seguir está a distribuição simulada do comportamento de 30 agentes em uma aldeia.
Cumprir as leis fiscais, alterar as leis
Os agentes de IA podem criar e modificar as suas próprias leis?
Em seguida, os pesquisadores testaram o agente implementando um sistema tributário. Verificou-se que não só cumpriram a legislação fiscal, mas também votaram democraticamente para alterar as taxas de imposto com base no sentimento público.
A propagação religiosa varia de cidade para cidade
Finalmente, os agentes de IA podem desenvolver a sua própria cultura?
Os pesquisadores analisaram especificamente a disseminação orgânica dos memes e acompanharam como os agentes formaram uma religião fictícia e se espalharam por meio de associações de agentes.
O que é ainda mais interessante é que as zonas rurais e as cidades apresentam padrões culturais diferentes.
Ex-alunos da Universidade de Pequim iniciam um negócio para construir IA empática
A razão pela qual o Projeto Sid foi lançado é porque a equipe da Altera AI espera que, ao explorar essas questões, os humanos digitais possam, em última análise, ser perfeitamente integrados à sociedade humana.
Robert Yang é o cofundador e CEO da Altera.
Anteriormente, ele recebeu doutorado em neurociência computacional pela Universidade de Nova York e pela Universidade de Yale, e bacharelado em física pela Universidade de Pequim.
Ele foi professor do Departamento de Ciências do Cérebro e Cognitivas e do Departamento de Engenharia Elétrica e Ciência da Computação do MIT, e líder do grupo MetaConscious do MIT.
Em 2023, ele fechou seu laboratório e deixou seu cargo efetivo no MIT para fundar a Altera.
Embora a equipe da Altera seja pequena, sua densidade de talentos é extremamente alta——
É composto por neurocientistas computacionais, atletas olímpicos da física e engenheiros do Departamento de Engenharia Elétrica e Ciência da Computação do MIT, Grupo de Processamento de Linguagem Natural de Stanford, Google X, Citadel, Supercell e muito mais.
Esta empresa, criada há mais de meio ano, recebeu 2 milhões de dólares em financiamento inicial no início do ano, liderado por Andreessen Horowitz.
Três meses depois, levantou outros US$ 9 milhões, liderados pela First Spark Ventures do ex-CEO do Google, Eric Schmidt, Patron VC, o investidor anjo Mitch Lasky e outros.
Em maio deste ano, a Altera abriu uma filial em Menlo Park e está empenhada em se tornar a primeira fornecedora de produtos de consumo inteligentes.