AI导读:

近年来,国内模型领域取得显著进步,DeepSeek-R1发布性能卓越且成本低廉,有望推动广泛应用落地。交互型多模态大模型支持多模态输入输出,实现“类人”反馈,引领人机交互变革。拓尔思、虹软科技等公司在该领域积极布局。

近年来,国内人工智能模型领域取得了显著进步,特别是在2024年,Kimi、豆包等模型成功出圈,逐步培养了用户的使用习惯。此次DeepSeek-R1的发布,不仅在性能上与OpenAI-o1正式版相媲美,更以更低的成本,有望推动下游应用的广泛落地及商业化机遇的拓展。

交互型多模态大模型作为一种跨越单一模态限制的技术创新,支持文本、音频、图像、视频等多种模态的任意组合输入输出,能够实现实时的、“类人”的理解与反馈,从而与人进行无缝交流。西部证券对此进行了深入分析,认为应用作为连接人类意图与信息及技术实现的桥梁,其核心在于交互。在大模型的迭代过程中,虽然性能提升至关重要,但交互的升级同样具有不可忽视的重大价值。交互型多模态大模型的出现,预示着人机交互将迎来一场深刻的变革,向着更为简洁、自然的自然语言交互形式迈进。此外,西部证券还指出,交互型多模态大模型在教育、编程、医疗健康、游戏、情感陪伴等多个领域均展现出广泛的应用前景。

据财联社主题库最新数据显示,相关上市公司在交互型多模态大模型领域积极布局:

拓尔思数字经济研究院及其研发团队已顺利完成康养大模型第一版本的训练工作,该版本融入了情感支持、主动问答以及多模态交互能力,并正在与虚拟人技术进行深度整合,以打造更加智能化、人性化的服务体验。

虹软科技则在视觉大模型与XR相关技术方面展现出强劲实力,利用ArcMuse技术引擎高效生成图片、视频、数字人以及3D内容等丰富资源,为XR眼镜等载体提供便捷、优质的内容生成引擎,助力虚拟现实技术的进一步发展。

(文章来源:财联社,本文信息仅供参考,不构成任何投资建议。)