AI导读:

国内两家人工智能大模型创业公司月之暗面与深度求索分别发布最新模型,k1.5与R1在多模态推理能力上取得显著突破,标志着中国AI技术正步入自主创新的新阶段。

2023年1月20日,国内人工智能领域迎来两大重要进展,北京月之暗面科技有限公司(简称“月之暗面”)与杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”)分别发布了其最新的人工智能大模型。

月之暗面此次推出的k1.5多模态思考模型,在SOTA级别的多模态推理和通用推理能力上取得了显著突破。在short-CoT模式下,Kimik1.5的数学、代码处理、视觉多模态及通用能力已超越GPT-4o和Claude 3.5 Sonnet。进入long-CoT模式,Kimi k1.5更是达到了OpenAI o1正式版的水平,标志着全球范围内首次有非OpenAI公司实现o1正式版的多模态推理性能。

与此同时,深度求索发布的DeepSeek-R1模型在后训练阶段大规模运用了强化学习技术,即便在标注数据极为有限的情况下,仍显著提升了模型的推理能力。在数学、代码和自然语言推理等核心任务上,DeepSeek-R1的性能与OpenAI o1正式版不相伯仲。值得注意的是,DeepSeek公布的测试数据显示,R1在美国AIME 2024、MATH-500和SWE-bench Verified等权威测试中的表现均优于OpenAI o1。

与OpenAI保持神秘的做法不同,这两家公司均大方分享了其技术原理及报告。Kimik1.5引入了原创的long2short技术,结合高效思维链与原生多模特性,而DeepSeek-R1则继续强调其高性价比优势。

中央民族大学教授郭全中对此评论道:“过去,中国AI公司大多跟随OpenAI的脚步,但从K1.5等国产大模型的崛起来看,以硅谷为中心的格局正悄然改变。国产大模型的突破不仅体现在技术指标的提升,更预示着中国AI技术正步入自主创新的新篇章。我们期待更多中国企业在全球AI舞台上大放异彩,共同推动人工智能技术迈向更高层次。”

人工智能模型发布现场

(文章来源:证券日报)