美东时间周三,Meta推出了一款新的开源模型V-JEPA2,可以让 Meta声称,V-JEPA2是一款世界模型,可以帮助 据悉,这种被称为世界模型的系统从物理世界的逻辑中汲取灵感,并按照现实世界的规则构建内部虚拟环境,从而让 Meta表示,V-JEPA2是一个拥有12亿参数的模型,经过了超过100万小时的视频训练,在物理世界中实现了最先进的视觉理解和预测性能。 例如,在Meta的新模型中,V-JEPA2可以识别从桌子上滚下来的球会掉下来,或者隐藏在视野之外的物体不会消失。 Meta认为V-JEPA2在自动驾驶汽车和送货 与依赖大量标记数据或视频片段的模型不同,V-JEPA2通过简化后的“潜在空间”进行推理,以理解物体是如何移动、相互作用以及如何响应的。 根据Meta的说法,V-JEPA2比 Meta首席人工智能科学家YannLeCunn声称,让机器理解物理世界与让它们理解语言是截然不同的。“世界模型提供了一个虚拟的、简化版的现实世界,人工智能可以参考它来理解世界,预测其行为的后果,因此它将能够计划一个行动方案来完成给定的任务。” LeCunn补充说:“我们相信,世界模型将为 (文章来源:财联社) |