在2025年的消費電子展(CES)上,NVIDIA正式發布了其全新的Cosmos平台,這一創新平台旨在加速物理人工智能(AI)系統的開發,特別是在自主駕駛車輛和機器人領域。 Cosmos平台集成了生成式世界基礎模型(WFM)、視頻標記器、安全防護機制以及一個高效的數據處理管道,這些功能使開發者能夠在減少對真實世界數據依賴的情況下,更加便捷地創建和優化AI模型。
Cosmos平台將通過開放模型許可的形式在Hugging Face和NVIDIA NGC目錄中提供,後續還將推出經過優化的NVIDIA NIM微服務,並通過NVIDIA AI企業軟件平台為企業提供全面支持。這一舉措將大大降低開發者使用高級AI技術的門檻,推動更多創新應用的誕生。
NVIDIA首席執行官黃仁勳在展會上表示:“機器人技術即將迎來像ChatGPT那樣的轉折時刻。與大型語言模型一樣,世界基礎模型是推動機器人和自主駕駛車輛發展的核心,但並非所有開發者都有能力和資源來訓練自己的模型。我們創建Cosmos就是為了讓物理AI的開發更加普及,讓每個開發者都能接觸到通用機器人技術。”黃仁勳的這番話揭示了Cosmos平台的核心理念——讓AI技術更加民主化。
Cosmos模型具備根據文本、圖像和傳感器數據生成基於物理的高清視頻的能力,使其適用於視頻搜索、合成數據生成和強化學習等多種應用場景。開發者可以根據具體需求定制模型,模擬工業環境、駕駛場景以及其他特定用例。此外,NVIDIA還推出了NeMo Curator,這是一個加速視頻處理管道,能夠在14天內處理2000萬小時的視頻數據,以及Cosmos Tokeniser,這是一個視覺數據壓縮工具,進一步提升了數據處理效率。
Agility Robotics的首席技術官Pras Velagapudi指出:“數據稀缺性和變異性是機器人環境成功學習的關鍵挑戰。Cosmos的文本、圖像和視頻到世界的能力使我們能夠生成和增強各種任務的場景,從而在不需要過多昂貴的真實數據捕獲的情況下訓練模型。”這一觀點凸顯了Cosmos平台在解決數據問題上的獨特優勢。
目前,多家主要的機器人和運輸公司,包括Agile Robots、XPENG、Waabi和Uber,已經開始採用Cosmos進行AI開發。 Uber首席執行官Dara Khosrowshahi表示:“生成式AI將驅動未來的出行,既需要豐富的數據,也需要強大的計算能力。通過與NVIDIA的合作,我們有信心幫助加速安全、可擴展的自主駕駛解決方案的進程。”這一合作標誌著Cosmos平台在實際應用中的廣泛認可。
除了Cosmos,NVIDIA還推出了Llama Nemotron大型語言模型和Cosmos Nemotron視覺語言模型,專為醫療、金融和製造等行業的企業使用而開發。這些新模型的推出進一步擴展了NVIDIA在AI領域的影響力,為企業提供了更多定制化的解決方案。
官方博客:https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development
劃重點:
Cosmos平台旨在加速自主駕駛車輛和機器人的開發,減少對真實數據的依賴。
開發者可以根據需求定制模型,生成多種應用場景的視頻數據。
多家機器人和運輸公司已開始使用Cosmos,加速AI技術的實際應用。