A startup norueguesa 1X Technologies fez progressos inovadores no desenvolvimento de modelos mundiais de inteligência artificial para robôs. O modelo que eles criaram funciona como um campo de treinamento virtual para os robôs, permitindo que eles sejam testados e melhorados com segurança e eficiência, sem a necessidade de testes demorados e caros no mundo real, o que é fundamental para resolver problemas de confiabilidade de longa data na robótica. . Esta tecnologia pode melhorar significativamente a adaptabilidade dos robôs em ambientes dinâmicos complexos e fornecer um forte apoio para o desenvolvimento de robôs de uso geral.
A startup norueguesa 1X Technologies anunciou recentemente que fez progressos significativos no desenvolvimento de modelos mundiais baseados em inteligência artificial para robôs. Simplificando, esses modelos são como campos de provas virtuais para robôs, permitindo que as máquinas sejam testadas e melhoradas em vários cenários sem a necessidade de testes reais em campo.
A 1X acredita que esta é a chave para resolver o “enigma dos robôs” – nomeadamente, como avaliar de forma fiável robôs treinados para múltiplas tarefas num ambiente em mudança. Tomemos como exemplo um robô que consegue dobrar camisetas. Seu desempenho variou ao longo de 50 dias, e a sensação de realização muitas vezes foi passageira.
1X diz que mesmo o mesmo modelo de robô pode sofrer enormes flutuações no desempenho quando o ambiente muda, tornando extremamente difícil uma avaliação rigorosa no mundo real.
Para treinar seu modelo de mundo, a 1X coletou milhares de horas de vídeos de seu robô humanóide EVE realizando diversas tarefas em residências e escritórios. Através do aprendizado de máquina, os modelos agora são capazes de prever razoavelmente como os objetos e o ambiente reagirão às ações do robô. O modelo pode produzir resultados visuais credíveis mesmo para comportamentos que não são explicitamente programados, como aprender a evitar o contacto com pessoas e objetos.
Atualmente, os modelos 1X são capazes de lidar com interações físicas complexas, como agarrar e levantar objetos, abrir portas e gavetas e manusear materiais deformáveis como roupas e até mesmo dobrar camisetas.
O valor central do seu modelo de mundo é simular a interação de objetos. Por exemplo, nas próximas gerações, os modelos terão a mesma tela inicial e três conjuntos diferentes de ações para pegar caixas. Em cada caso, a caixa agarrada é levantada e movida com os movimentos do robô, enquanto as outras caixas permanecem no lugar.
Ainda assim, 1X reconhece algumas limitações. Por exemplo, os modelos às vezes têm dificuldade em manter a cor e a forma dos objetos consistentes ou em simular fenômenos físicos com precisão. A capacidade de se reconhecer no espelho também permanece pouco confiável.
Apesar dos desafios, a 1X vê estes modelos mundiais como um marco no desenvolvimento e formação de robôs universais. Para acelerar o progresso, a empresa também oferece conjuntos de dados, modelos pré-treinados e prêmios em dinheiro por meio do 1X World Model Challenge.
O objetivo de longo prazo do 1X é usar diretamente o modelo mundial para treinamento de robôs, o que trará enormes melhorias de eficiência em comparação com testes reais. Para atingir esse objetivo, eles estão recrutando ativamente especialistas na área de inteligência artificial. No início deste ano, a 1X também levantou com sucesso US$ 100 milhões em financiamento para promover o lançamento no mercado de seu robô humanóide doméstico Neo. Este financiamento recebeu apoio de líderes da indústria como a OpenAI, demonstrando plenamente seu alto nível de compromisso com a tecnologia 1X.
Além do 1X, a Nvidia também está investindo pesado em robôs humanóides. A empresa lançou recentemente um método de treinamento usando o Vision Pro da Apple, e o pesquisador da Nvidia, Jim Fan, acredita que a robótica terá um “momento GPT-3” nos próximos anos.
A tecnologia de modelo mundial da 1X Technologies aponta o caminho para o desenvolvimento futuro da robótica. Embora ainda existam desafios, o seu potencial é enorme e espera-se que revolucione a forma como os robôs são treinados e aplicados no futuro. Esta tecnologia não só melhorará muito a eficiência, mas também promoverá o rápido progresso da tecnologia robótica e trará mais possibilidades à sociedade humana.