Recientemente, abrazando la cara e inteligencia física lanzó conjuntamente "PI0" (Pi-Zero), el primer modelo básico que convierte directamente los comandos del lenguaje natural en acciones físicas. Este lanzamiento innovador ha atraído una atención generalizada, y Remi Cadene, científico de investigación jefe de Hugging Face, anunció en las redes sociales que "PI0 es el modelo de acción de lenguaje visual más avanzado que puede transformar los comandos del lenguaje natural en un comportamiento autónomo".
El lanzamiento de "PI0" marca un cambio importante en el campo de la robótica, similar a la influencia de ChatGPT en el campo de la generación de texto. Originalmente desarrollado por la inteligencia física y ahora disponible en la plataforma Lerobot de Hugging Face, el modelo es capaz de realizar tareas complejas, como plegar ropa, empacar mesas comedor y empacar comestibles, habilidades que los robots tradicionales son difíciles de dominar.
"Los robots actuales tienden a ser expertos en dominios estrechos que se centran en acciones repetitivas, mientras que la introducción de 'PI0' permite a los robots aprender y realizar tareas a través de las instrucciones del usuario, y la complejidad de la programación se reduce a una voz simple. Instrucción".
El núcleo de la tecnología "PI0" es un avance tecnológico importante. El modelo entrena datos de siete plataformas de robots diferentes y 68 tareas únicas, lo que le permite manejar tareas que van desde operaciones finas hasta procedimientos complejos de múltiples pasos. Al mismo tiempo, se utiliza una nueva tecnología de coincidencia de flujo para permitirle producir trayectorias de acción suaves y en tiempo real a 50 veces por segundo, logrando así una alta precisión y adaptabilidad en aplicaciones del mundo real.
Sobre esta base, el equipo de desarrollo también lanzó la versión "PI0 -Fast", que combina un nuevo esquema de marcado: la secuencia de acción espacial de frecuencia (FAST), que aumenta la velocidad de entrenamiento en cinco veces, y la capacidad de generalización también se ha mejorado entre diferentes entornos y tipos de robots.
La introducción de esta tecnología tendrá un profundo impacto en la industria. Los fabricantes pueden reprogramar robots con comandos de voz simples, mientras que los almacenes pueden implementar sistemas de automatización más flexibles según sea necesario. Las pequeñas empresas también serán más fáciles de acceder a la robótica, reduciendo las barreras para la programación y la implementación.
Sin embargo, a pesar del progreso significativo de "PI0", todavía hay algunos desafíos. Este modelo a veces puede encontrar dificultades cuando se trata de tareas muy complejas y requiere considerables recursos informáticos. Además, los problemas de confiabilidad y seguridad en entornos industriales aún necesitan atención.
El lanzamiento de "PI0" se produce en un período crítico de rápido desarrollo de la industria de inteligencia artificial, y representa el primer intento exitoso entre los modelos de idiomas y el mundo físico. A medida que la tecnología continúa madurando, los robots en el futuro se volverán más conversacionales, adaptables y fáciles de acceder, promoviendo el uso generalizado de robots en campos como hogares, hospitales y pequeñas empresas.
PI0: https://huggingface.co/lerobot/pi0
Puntos clave:
PI0 es el primer modelo de robot que convierte los comandos del lenguaje natural en acciones físicas, cambiando el método de programación tradicional.
Este modelo ha sido entrenado por multiplataforma y tareas múltiples, y puede realizar operaciones diarias complejas y reducir el umbral para el uso de robots.
La versión PI0-Fast mejora la velocidad de entrenamiento y las capacidades de generalización, y se espera que acelere la promoción de la automatización industrial.
Con el lanzamiento de la tecnología "PI0", el campo de los robots ha introducido nuevos cambios y será más inteligente y conveniente en el futuro.