Recentemente, abraçando o rosto e a inteligência física lançou em conjunto "PI0" (Pi-Zero), o primeiro modelo básico a converter diretamente comandos de linguagem natural em ações físicas. Esse lançamento inovador atraiu atenção generalizada, e Remi Cadene, cientista -chefe de pesquisa da Hugging Face, anunciou nas mídias sociais que "o PI0 é o modelo de ação de linguagem visual mais avançado que pode transformar os comandos de linguagem natural em comportamento autônomo".
O lançamento do "PI0" marca uma grande mudança no campo da robótica, semelhante à influência do ChatGPT no campo da geração de texto. Originalmente desenvolvido pela inteligência física e agora disponível na plataforma LeroBot do Hugging Face, o modelo é capaz de executar tarefas complexas, como dobrar roupas, embalar mesas de jantar e compras de embalagens, habilidades que os robôs tradicionais são difíceis de dominar.
"Os robôs atuais tendem a ser especialistas em domínio estreito, focado em ações repetitivas, enquanto a introdução do 'PI0' permite que os robôs aprendam e executem tarefas por meio de instruções do usuário, e a complexidade da programação é reduzida à voz simples. Instruções".
O núcleo da tecnologia "PI0" é um importante avanço tecnológico. O modelo treina dados de sete plataformas de robô diferentes e 68 tarefas exclusivas, permitindo lidar com tarefas que variam de operações finas a procedimentos complexos de várias etapas. Ao mesmo tempo, uma nova tecnologia de correspondência de fluxo é usada para permitir produzir trajetórias de ação suaves e em tempo real em 50 vezes por segundo, alcançando assim alta precisão e adaptabilidade em aplicações do mundo real.
Nesta base, a equipe de desenvolvimento também lançou a versão "Pi0 -Fast", que combina um novo esquema de marcação - marcador de sequência de ação espacial de frequência (FAST), que aumenta a velocidade de treinamento em cinco vezes, e a capacidade de generalização também foi melhorada entre diferentes ambientes e tipos de robôs.
A introdução dessa tecnologia terá um impacto profundo na indústria. Os fabricantes podem reprogramar robôs com comandos de voz simples, enquanto os armazéns podem implantar sistemas de automação mais flexíveis, conforme necessário. As pequenas empresas também serão mais fáceis de acessar a robótica, diminuindo as barreiras à programação e implantação.
No entanto, apesar do progresso significativo de "PI0", ainda existem alguns desafios. Às vezes, esse modelo pode encontrar dificuldades ao lidar com tarefas muito complexas e requer recursos de computação consideráveis. Além disso, questões de confiabilidade e segurança em ambientes industriais ainda precisam de atenção.
O lançamento de "PI0" ocorre em um período crítico de rápido desenvolvimento da indústria de inteligência artificial e representa a primeira tentativa bem -sucedida entre modelos de idiomas e o mundo físico. À medida que a tecnologia continua a amadurecer, os robôs no futuro se tornarão mais conversacionais, adaptáveis e fáceis de acessar, promovendo o uso generalizado de robôs em áreas como casas, hospitais e pequenas empresas.
PI0: https://huggingface.co/lerobot/pi0
Pontos -chave:
O PI0 é o primeiro modelo de robô a converter comandos de linguagem natural em ações físicas, alterando o método tradicional de programação.
Este modelo foi treinado por várias plataformas e várias tarefas e pode executar operações diárias complexas e diminuir o limite para o uso de robôs.
A versão PI0-FAST melhora a velocidade de treinamento e os recursos de generalização e deve acelerar a promoção da automação industrial.
Com o lançamento da tecnologia "PI0", o campo dos robôs inaugurou novas mudanças e será mais inteligente e conveniente no futuro.