抱きしめる顔と物理的知性は、自然言語コマンドをロボットアクションに直接変換できる最初のオープンソースモデルである革新的な基本ロボットモデルPI0を立ち上げました。この画期的なテクノロジーは、複数の分野で大きな可能性を示しているだけでなく、インテリジェントロボットの将来の発展の方向性を指摘しています。
顔と物理的知性を抱きしめることで、自然言語コマンドをロボットアクションに直接変換できる最初のオープンソースモデルであるエポック製造の基本ロボットモデルPI0を共同で発売しました。
PI0モデルは、7つの異なるロボットプラットフォームとMasters 68のユニークなタスクでトレーニングされており、折りたたみ式の衣服からテーブルまで複雑な操作を実行できます。このモデルは、革新的なフローマッチングテクノロジーを使用して、50Hzの周波数でスムーズなリアルタイムモーション軌道を生成し、非常に高い精度を確保します。
さらに注目に値するのは、R&Dチームが同時にPI0-FASTのアップグレードバージョンを起動し、新しい周波数空間アクションシーケンスマーキングスキームを採用し、トレーニング速度を5倍に増やし、より強力な環境の適応性を示すことです。
Hugging Faceのチーフ研究科学者であるRemi Cadeneは、「PI0は、自然言語コマンドを自律的な動作に直接変換できる最も高度な視覚言語アクションモデルであり、開発者のみがオープンソースになります。コードの数行が必要です。
このブレークスルーは複数の産業を再構築する可能性があります。製造工場は、口頭での指示を通じてロボットタスクを再構成でき、倉庫と物流はより柔軟な自動化システムを展開でき、中小企業でさえロボット工学をより簡単に採用できます。ただし、課題は、リソースの要件、信頼性、セキュリティの計算に関して残っています。
AI業界全体では、PI0のリリースはちょうどいいです。一般的な人工知能の発展におけるますます激しい競争に伴い、この技術は言語モデルと物理的世界の間に橋渡しを成功裏に構築し、将来のインテリジェントロボットの開発の方向を指摘しています。
PI0モデルの発売は、ロボット技術の飛躍であるだけでなく、人工知能と物理的世界の深い統合における重要なマイルストーンでもあり、インテリジェントロボットが将来より人気があり効率的であることを示しています。