英伟达与丰田合作发掘“世界AI”新商机
2025/02/07
Cosmos是一个有助于模拟的平台。英伟达将Cosmos的基础模型称为“世界基础模型(World Foundation Models、WFM)”。一般来说,用于自动驾驶等的理解现实世界物理法则和因果关系等的模型被称为“世界模型(World Model)”。世界基础模型也接近这一概念。已公开的Cosmos第一代模型使用对现实世界进行拍摄的2000万小时视频数据等进行了事先学习。也就是说,通过实际影像学习物理法则。
英伟达CEO黄仁勋在发表主题演讲的第二天召开媒体联合采访会,表示“(CES的)主题演讲中最重要的事情之一就是世界基础模型。就像(美国OpenAI公司开发的)GPT是理解语言的基础模型一样,世界基础模型能理解摩擦、惯性、物体的存在、几何学和空间性。能理解语言模型无法理解的物理世界”。这就是所谓的“世界AI”。
“用于训练AI的AI”
Cosmos可以生成用于训练物理AI的合成数据。也就是说,定位成用于训练AI的AI。如果在Omniverse的虚拟空间中输入传感器等三维数据和用CAD制作的对象数据,用自然语言发出指示,就可以制作人工智能训练用的写实视频。
例如,下面的图片输入了从建筑物传感器获取的数据、用CAD制作的汽车和货架等对象。
如果对Cosmos输入“这个场景是从一个旧仓库里透过敞开的车库门向外看的情形”、“暗淡的阳光从门口射进来”、“有一个布满灰尘的储物架贴着墙壁”、“地板是水泥的,可以看到磨损”、“汽车是干净的轿跑,反射着周围的环境”之类的描述,就会生成视频。
![]() |
| 将传感器数据和以CAD制作的数据输入Omniverse |
![]() |
| 通过用自然语言向Cosmos发出指令,可以生成写实的数据 |
![]() |
| 即使使用相同的数据,也能通过改变指令来生成不同的合成数据 |
视频由三维的矢量数据组成,可以自由改变对象的位置等。如果将指令改为“晴朗的阳光”、“新建的仓库”、“湿地板”等,就可以生成不同情况下的合成数据。
“机器人和自动驾驶汽车的学习所需的是具有真实感的数据。并非图像生成式AI创造的幻想的世界”,在CES上的英伟达展区,负责人这样解释道。
通过学习周围的世界,Cosmos可以生成高度真实的合成数据。在英伟达负责Omniverse的副总裁雷夫·莱巴雷迪安(Rev Lebaredian)解释称,“WFM的风险是幻觉,这正是作为Omniverse的伙伴而开发Cosmos的原因。它们是生成根植于现实世界的合成数据的理想组合”。
借助AI,E2E的机器人和自动驾驶的可行性越来越高。随着用于学习的合成数据以Cosmos实现量产,技术开发或将进一步取得进展。
资料来源:https://business.nikkei.com/atcl/gen/19/00511/011500044/
By Sho Shimazu
![]() |
| 更多资讯请关注日经BP微信公众号 |
报道评论
HotNews
金融市场
| 日经225指数 | 54245.54 | -2033.51 | 03/04 | close |
| 日经亚洲300i | 2593.96 | -134.27 | 03/04 | close |
| 美元/日元 | 157.08 | -0.33 | 03/05 | 04:23 |
| 美元/人民元 | 6.8965 | -0.0027 | 03/04 | 18:00 |
| 道琼斯指数 | 48784.11 | 282.84 | 03/04 | 14:18 |
| 富时100 | 10567.650 | 83.520 | 03/04 | 16:35 |
| 上海综合 | 4082.4740 | -40.2020 | 03/04 | close |
| 恒生指数 | 25249.48 | -518.60 | 03/04 | close |
| 纽约黄金 | 5107.4 | -187.0 | 03/03 | close |