AI导读:

DeepSeek公司发布通用大模型DeepSeek-R1,以低成本高性能在全球引起轰动。该模型通过四大创新技术实现性能大幅提升,并采取完全开源策略。尽管我国AI原始创新存在短板,但DeepSeek的崛起为产业发展带来启示。未来应加强基础研究、技术创新和自主产业生态建设。

  今年1月,深度求索(Deepseek)公司发布通用大模型DeepSeek-R1,其低成本、高性能的特点在全球引起巨大轰动。DeepSeek的崛起标志着我国AI发展的一个重要里程碑,为产业发展带来了诸多启示。

  DeepSeek通过并行线程执行(PTX)、混合专家模型(MoE)、多头潜在注意力(MLA)和多Token预测(MTP)四大创新技术,在算力资源有限的情况下,实现了模型性能的大幅提升,并将训练成本降低到行业标杆的10%。这一突破不仅降低了大模型的部署门槛,还证明了通过算法优化可以弥补算力不足的可行性,为我国AI发展探索出一条多元化路径。

  同时,DeepSeek采取完全开源的策略,公开算法、模型权重及训练细节,吸引了全球开发者的关注和参与。这种开源生态有助于技术迭代和创新,有望打破行业垄断格局。

  尽管DeepSeek取得了显著突破,但我国AI原始创新仍存在短板。在2023年全球生成式AI研究机构引用排名中,中国仅占一席。在AI专利数、深度学习模型、机器学习加速硬件等方面,我国与美国仍有较大差距。

  当前,我国数据基础制度建设尚处于起步阶段,数据获取和交换机制尚不完善,导致大模型可用的数据有限。此外,数据标注是高质量数据供给的基础,但由于专业化标注人才短缺,我国数据标注质量仍有待提升,特别是在医疗、自动驾驶等领域。

  从全球来看,DeepSeek等国产大模型在全球技术生态中的影响力仍有待提升。在国内,我国AI发展从基础研究到技术创新再到场景应用的全链条尚未完全打通,支撑大模型迭代发展的技术、资金、数据、人才等要素流动存在障碍。

  为此,应加强AI基础研究和技术创新,推动AI与基础学科的交叉融合,提升研究水平。同时,鼓励AI技术开源开放,促进技术创新和生态建设。

  统筹大规模数据集建设,加快数据基础制度建设,推动公共数据集和专业应用数据集建设。针对不同应用场景,制定细化的数据标注规范,提升数据标注质量。

  发掘具有中国特色的AI初创企业估值模型和平台系统,为政府、金融机构识别高价值AI初创企业提供参考,为国产AI技术发展注入活力。

  打造AI自主产业生态,发挥我国海量数据和丰富应用场景优势,聚焦智能制造、自动驾驶等重点领域,建设行业通用大模型平台,推动产业链上下游深度合作,持续迭代自主产业生态。

(文章来源:经济日报)