DeepSeek大模型发布:AI发展里程碑与未来展望
AI导读:
DeepSeek公司发布通用大模型DeepSeek-R1,以低成本高性能在全球引起轰动。该模型通过四大创新技术实现性能大幅提升,并采取完全开源策略。尽管我国AI原始创新存在短板,但DeepSeek的崛起为产业发展带来启示。未来应加强基础研究、技术创新和自主产业生态建设。
今年1月,深度求索(Deepseek)公司发布通用大模型DeepSeek-R1,其低成本、高性能的特点在全球引起巨大轰动。DeepSeek的崛起标志着我国AI发展的一个重要里程碑,为产业发展带来了诸多启示。
DeepSeek通过并行线程执行(PTX)、混合专家模型(MoE)、多头潜在注意力(MLA)和多Token预测(MTP)四大创新技术,在算力资源有限的情况下,实现了模型性能的大幅提升,并将训练成本降低到行业标杆的10%。这一突破不仅降低了大模型的部署门槛,还证明了通过算法优化可以弥补算力不足的可行性,为我国AI发展探索出一条多元化路径。
同时,DeepSeek采取完全开源的策略,公开算法、模型权重及训练细节,吸引了全球开发者的关注和参与。这种开源生态有助于技术迭代和创新,有望打破行业垄断格局。
尽管DeepSeek取得了显著突破,但我国AI原始创新仍存在短板。在2023年全球生成式AI研究机构引用排名中,中国仅占一席。在AI专利数、深度学习模型、机器学习加速硬件等方面,我国与美国仍有较大差距。
当前,我国数据基础制度建设尚处于起步阶段,数据获取和交换机制尚不完善,导致大模型可用的数据有限。此外,数据标注是高质量数据供给的基础,但由于专业化标注人才短缺,我国数据标注质量仍有待提升,特别是在医疗、自动驾驶等领域。
从全球来看,DeepSeek等国产大模型在全球技术生态中的影响力仍有待提升。在国内,我国AI发展从基础研究到技术创新再到场景应用的全链条尚未完全打通,支撑大模型迭代发展的技术、资金、数据、人才等要素流动存在障碍。
为此,应加强AI基础研究和技术创新,推动AI与基础学科的交叉融合,提升研究水平。同时,鼓励AI技术开源开放,促进技术创新和生态建设。
统筹大规模数据集建设,加快数据基础制度建设,推动公共数据集和专业应用数据集建设。针对不同应用场景,制定细化的数据标注规范,提升数据标注质量。
发掘具有中国特色的AI初创企业估值模型和平台系统,为政府、金融机构识别高价值AI初创企业提供参考,为国产AI技术发展注入活力。
打造AI自主产业生态,发挥我国海量数据和丰富应用场景优势,聚焦智能制造、自动驾驶等重点领域,建设行业通用大模型平台,推动产业链上下游深度合作,持续迭代自主产业生态。
(文章来源:经济日报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。