AI导读:

在2025年国际消费类电子产品展览会(CES 2025)上,英伟达、谷歌等全球科技巨头宣布涉足人工智能领域的关键方向——世界模型。世界模型具备自主决策能力和成本控制优势,被视为汽车智能化领域的一道分水岭,将推动自动驾驶等应用迎来高光时刻。

在万众瞩目的2025年国际消费类电子产品展览会(CES 2025)上,全球科技巨头英伟达、谷歌以及世界实验室等领军企业纷纷宣布涉足人工智能领域的最前沿阵地——世界模型(World Models)。这一举动标志着世界模型正成为科技界竞相追逐的焦点。

世界模型,这一术语最早起源于机器学习领域,其初衷是为物理交互、工业环境模拟及驾驶环境的高质量生成而量身定制。目前,世界模型已在生成逼真视频以训练机器人和自动驾驶汽车方面展现出巨大潜力。通过创建合成训练数据,这些模型能够帮助机器人和汽车更深入地理解物理世界。

世界模型之所以备受瞩目,首要原因在于其“自主决策”能力。相较于语言模型仍停留在理解人类语义的初级阶段,世界模型已从一维的数字智能迈向三维的空间智能,开始真正理解物理世界,创建对现实世界运作方式的内部表征,并据此推理行为的后果。这种潜意识里的推理和决策能力,被视为实现人类级智能不可或缺的一环。

其次,世界模型在成本控制方面同样展现出显著优势。自动驾驶技术的成长离不开海量数据的“滋养”,然而现实测试中危险场景和长尾数据的稀缺成为制约其发展的瓶颈。此外,3D重建的高成本和低效率也限制了自动驾驶技术的进一步推广。而世界模型作为一种高效的场景生成和预测工具,能够自主“创造数据”,用于场景数据增强、危险场景生成以及算法评测等应用,从而有效降低自动驾驶研发中的训练数据成本。

笔者认为,在自动驾驶领域,世界模型的应用将开启全新的训练模式。通过生成带有预测性质的视频数据,世界模型能够实现极端情况下的多样化训练,并采用强化学习的方法帮助自动驾驶系统认识复杂的驾驶环境,通过视频输出驾驶决策。

然而,尽管世界模型在理论上具有无限潜力,但在实际应用中仍面临诸多挑战。环境模拟的准确性高度依赖于模型复杂度和数据质量,要精确预测复杂环境中的动态变化,需要庞大的数据量和强大的计算资源支持。这不仅需要巨额成本投入,还需要漫长的研发周期。此外,如何在不同应用场景中调整模型参数以适应特定需求也是亟待解决的问题。

尽管如此,世界模型仍被视为汽车智能化领域的一道分水岭。其在场景生成、模型训练、仿真测试以及数据闭环等方面的独特优势,将推动自动驾驶、机器人等人工智能应用迎来前所未有的高光时刻。未来,随着技术的不断进步和应用的深入拓展,世界模型有望在人工智能领域发挥更加重要的作用。

(文章来源:证券日报

CES 2025展会现场