OpenAI发布Sora-Turbo视频生成大模型

产业经讯 2024-12-11 06:11:26 来源：解放日报作者：网络

AI导读：

OpenAI发布最新版本的视频生成大模型Sora-Turbo，该模型在实用性与技术成熟度上有所提升，将对视频创作、游戏开发等行业产生深远影响，但平衡技术创新与隐私保护仍是未来发展的关键。

本报记者黄海华报道

当地时间12月9日，美国OpenAI公司隆重推出了最新迭代的视频生成大模型——Sora-Turbo。这一新版本不仅能够基于文本、图像或视频输入生成全新的视频内容，更是自今年2月首次亮相后的重大技术飞跃。

针对此次发布，本报记者专访了上海交通大学长聘教轨副教授、计算机视觉领域专家谢伟迪。谢教授指出：“相较于首个版本，Sora-Turbo在实用性和技术成熟度上均实现了显著提升。然而，由于新版本发布周期较长，其他竞争对手已迎头赶上。与国内的‘可灵’视频生成大模型相比，Sora-Turbo在视频生成质量上并未展现出颠覆性的进步。”

那么，Sora-Turbo相较于旧版究竟有哪些“升级”？谢伟迪解释道，早期的Sora更像是一个学术概念验证，通过扩大数据量和模型规模，展示了视频生成领域的巨大潜力，并为当时的生成模型研究指明了方向。尽管当时尚未推出可供公众使用的成品模型，但Sora的探索已经充分证明了数据与模型规模提升所带来的显著效果。

在与国内外众多视频生成模型的对比中，谢伟迪表示：“Sora-Turbo在生成复杂场景和多主体互动视频时表现出色，能够呈现出逼真的动态效果和细腻的画面细节。然而，在物理规律的深入理解和物理特性的精确模拟方面，Sora-Turbo仍有待提升。例如，在生成物体运动或光影变化等场景时，其效果可能不够符合现实物理特性。此外，与Gen-3等轻量化模型相比，Sora-Turbo在硬件适配性和生成速度方面仍有进一步提升的空间，以满足更广泛用户的需求。”

相较于部分更注重速度的模型，Sora-Turbo更加注重生成内容的合规性和道德规范，这在需要严格监管的应用场景中尤为突出。然而，谢伟迪也透露：“目前，Sora尚未向我们开放，无法进行规模化生成和测试。”

视频生成大模型的出现将对我们的生活产生哪些潜在影响？谢伟迪认为，这将极大提升视频创作效率，并为游戏的开发、体验方式带来创新，为故事讲述、互动和沉浸式体验开辟新的可能。借助视频生成大模型，用户只需提供简短的文本描述，即可自动生成高质量视频，这不仅节省了时间，还降低了对专业技能的要求。

视频生成大模型的广泛应用有望重塑广告营销、产品推广和教育辅导等多个行业的内容创作流程，推动生产力升级。在娱乐领域，视频生成大模型将让更多用户快速创作和分享创意，进一步推动短视频文化的发展，并可能催生更多创新形式和互动体验。

然而，平衡技术创新与隐私保护，是视频生成大模型未来发展的关键。建立严格的数据保护措施、透明的使用政策以及完善的内容监管机制，不仅是对用户信任的维护，更是推动技术普及与创新的重要基石。

（图片来源：网络）（文章来源：解放日报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。