DeepSeek大模型发布：AI发展里程碑与未来展望

财经聚焦 2025-02-19 06:02:18 来源：经济日报作者：网络

AI导读：

DeepSeek公司发布通用大模型DeepSeek-R1，以低成本高性能在全球引起轰动。该模型通过四大创新技术实现性能大幅提升，并采取完全开源策略。尽管我国AI原始创新存在短板，但DeepSeek的崛起为产业发展带来启示。未来应加强基础研究、技术创新和自主产业生态建设。

　　今年1月，深度求索（Deepseek）公司发布通用大模型DeepSeek-R1，其低成本、高性能的特点在全球引起巨大轰动。DeepSeek的崛起标志着我国AI发展的一个重要里程碑，为产业发展带来了诸多启示。

　　DeepSeek通过并行线程执行（PTX）、混合专家模型（MoE）、多头潜在注意力（MLA）和多Token预测（MTP）四大创新技术，在算力资源有限的情况下，实现了模型性能的大幅提升，并将训练成本降低到行业标杆的10%。这一突破不仅降低了大模型的部署门槛，还证明了通过算法优化可以弥补算力不足的可行性，为我国AI发展探索出一条多元化路径。

　　同时，DeepSeek采取完全开源的策略，公开算法、模型权重及训练细节，吸引了全球开发者的关注和参与。这种开源生态有助于技术迭代和创新，有望打破行业垄断格局。

　　尽管DeepSeek取得了显著突破，但我国AI原始创新仍存在短板。在2023年全球生成式AI研究机构引用排名中，中国仅占一席。在AI专利数、深度学习模型、机器学习加速硬件等方面，我国与美国仍有较大差距。

　　当前，我国数据基础制度建设尚处于起步阶段，数据获取和交换机制尚不完善，导致大模型可用的数据有限。此外，数据标注是高质量数据供给的基础，但由于专业化标注人才短缺，我国数据标注质量仍有待提升，特别是在医疗、自动驾驶等领域。

　　从全球来看，DeepSeek等国产大模型在全球技术生态中的影响力仍有待提升。在国内，我国AI发展从基础研究到技术创新再到场景应用的全链条尚未完全打通，支撑大模型迭代发展的技术、资金、数据、人才等要素流动存在障碍。

　　为此，应加强AI基础研究和技术创新，推动AI与基础学科的交叉融合，提升研究水平。同时，鼓励AI技术开源开放，促进技术创新和生态建设。

　　统筹大规模数据集建设，加快数据基础制度建设，推动公共数据集和专业应用数据集建设。针对不同应用场景，制定细化的数据标注规范，提升数据标注质量。

　　发掘具有中国特色的AI初创企业估值模型和平台系统，为政府、金融机构识别高价值AI初创企业提供参考，为国产AI技术发展注入活力。

　　打造AI自主产业生态，发挥我国海量数据和丰富应用场景优势，聚焦智能制造、自动驾驶等重点领域，建设行业通用大模型平台，推动产业链上下游深度合作，持续迭代自主产业生态。

（文章来源：经济日报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。