AI导读:

OpenAI发布最新版本的视频生成大模型Sora-Turbo,该模型在实用性与技术成熟度上有所提升,将对视频创作、游戏开发等行业产生深远影响,但平衡技术创新与隐私保护仍是未来发展的关键。

本报记者黄海华报道

当地时间12月9日,美国OpenAI公司隆重推出了最新迭代的视频生成大模型——Sora-Turbo。这一新版本不仅能够基于文本、图像或视频输入生成全新的视频内容,更是自今年2月首次亮相后的重大技术飞跃。

针对此次发布,本报记者专访了上海交通大学长聘教轨副教授、计算机视觉领域专家谢伟迪。谢教授指出:“相较于首个版本,Sora-Turbo在实用性和技术成熟度上均实现了显著提升。然而,由于新版本发布周期较长,其他竞争对手已迎头赶上。与国内的‘可灵’视频生成大模型相比,Sora-Turbo在视频生成质量上并未展现出颠覆性的进步。”

那么,Sora-Turbo相较于旧版究竟有哪些“升级”?谢伟迪解释道,早期的Sora更像是一个学术概念验证,通过扩大数据量和模型规模,展示了视频生成领域的巨大潜力,并为当时的生成模型研究指明了方向。尽管当时尚未推出可供公众使用的成品模型,但Sora的探索已经充分证明了数据与模型规模提升所带来的显著效果。

在与国内外众多视频生成模型的对比中,谢伟迪表示:“Sora-Turbo在生成复杂场景和多主体互动视频时表现出色,能够呈现出逼真的动态效果和细腻的画面细节。然而,在物理规律的深入理解和物理特性的精确模拟方面,Sora-Turbo仍有待提升。例如,在生成物体运动或光影变化等场景时,其效果可能不够符合现实物理特性。此外,与Gen-3等轻量化模型相比,Sora-Turbo在硬件适配性和生成速度方面仍有进一步提升的空间,以满足更广泛用户的需求。”

相较于部分更注重速度的模型,Sora-Turbo更加注重生成内容的合规性和道德规范,这在需要严格监管的应用场景中尤为突出。然而,谢伟迪也透露:“目前,Sora尚未向我们开放,无法进行规模化生成和测试。”

视频生成大模型的出现将对我们的生活产生哪些潜在影响?谢伟迪认为,这将极大提升视频创作效率,并为游戏的开发、体验方式带来创新,为故事讲述、互动和沉浸式体验开辟新的可能。借助视频生成大模型,用户只需提供简短的文本描述,即可自动生成高质量视频,这不仅节省了时间,还降低了对专业技能的要求。

视频生成大模型的广泛应用有望重塑广告营销、产品推广和教育辅导等多个行业的内容创作流程,推动生产力升级。在娱乐领域,视频生成大模型将让更多用户快速创作和分享创意,进一步推动短视频文化的发展,并可能催生更多创新形式和互动体验。

然而,平衡技术创新与隐私保护,是视频生成大模型未来发展的关键。建立严格的数据保护措施、透明的使用政策以及完善的内容监管机制,不仅是对用户信任的维护,更是推动技术普及与创新的重要基石。

(图片来源:网络)(文章来源:解放日报)