在2025年的消费电子展(CES)上,NVIDIA正式发布了其全新的Cosmos平台,这一创新平台旨在加速物理人工智能(AI)系统的开发,特别是在自主驾驶车辆和机器人领域。Cosmos平台集成了生成式世界基础模型(WFM)、视频标记器、安全防护机制以及一个高效的数据处理管道,这些功能使开发者能够在减少对真实世界数据依赖的情况下,更加便捷地创建和优化AI模型。
Cosmos平台将通过开放模型许可的形式在Hugging Face和NVIDIA NGC目录中提供,后续还将推出经过优化的NVIDIA NIM微服务,并通过NVIDIA AI企业软件平台为企业提供全面支持。这一举措将大大降低开发者使用高级AI技术的门槛,推动更多创新应用的诞生。
NVIDIA首席执行官黄仁勋在展会上表示:“机器人技术即将迎来像ChatGPT那样的转折时刻。与大型语言模型一样,世界基础模型是推动机器人和自主驾驶车辆发展的核心,但并非所有开发者都有能力和资源来训练自己的模型。我们创建Cosmos就是为了让物理AI的开发更加普及,让每个开发者都能接触到通用机器人技术。”黄仁勋的这番话揭示了Cosmos平台的核心理念——让AI技术更加民主化。
Cosmos模型具备根据文本、图像和传感器数据生成基于物理的高清视频的能力,使其适用于视频搜索、合成数据生成和强化学习等多种应用场景。开发者可以根据具体需求定制模型,模拟工业环境、驾驶场景以及其他特定用例。此外,NVIDIA还推出了NeMo Curator,这是一个加速视频处理管道,能够在14天内处理2000万小时的视频数据,以及Cosmos Tokeniser,这是一个视觉数据压缩工具,进一步提升了数据处理效率。
Agility Robotics的首席技术官Pras Velagapudi指出:“数据稀缺性和变异性是机器人环境成功学习的关键挑战。Cosmos的文本、图像和视频到世界的能力使我们能够生成和增强各种任务的场景,从而在不需要过多昂贵的真实数据捕获的情况下训练模型。”这一观点凸显了Cosmos平台在解决数据问题上的独特优势。
目前,多家主要的机器人和运输公司,包括Agile Robots、XPENG、Waabi和Uber,已经开始采用Cosmos进行AI开发。Uber首席执行官Dara Khosrowshahi表示:“生成式AI将驱动未来的出行,既需要丰富的数据,也需要强大的计算能力。通过与NVIDIA的合作,我们有信心帮助加速安全、可扩展的自主驾驶解决方案的进程。”这一合作标志着Cosmos平台在实际应用中的广泛认可。
除了Cosmos,NVIDIA还推出了Llama Nemotron大型语言模型和Cosmos Nemotron视觉语言模型,专为医疗、金融和制造等行业的企业使用而开发。这些新模型的推出进一步扩展了NVIDIA在AI领域的影响力,为企业提供了更多定制化的解决方案。
官方博客:https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development
划重点:
Cosmos平台旨在加速自主驾驶车辆和机器人的开发,减少对真实数据的依赖。
开发者可以根据需求定制模型,生成多种应用场景的视频数据。
多家机器人和运输公司已开始使用Cosmos,加速AI技术的实际应用。