中金公司研报：DeepSeek引领AI技术趋势，建议关注应用层投资机遇

商业视界 2025-02-11 20:47:12 来源：大河财立方作者：网络

AI导读：

中金公司研报指出，DeepSeek在AI领域出圈，技术创新与工程能力突出。建议2025年关注国内模型性能优化背景下的应用层投资机遇，DeepSeek有望推动大模型应用端广泛普及。

【大河财立方消息】2月11日，中金公司研报指出，Deepseek于2025年1月末全球范围内出圈，App端DAU达2215万，在AI产品日活总榜中仅次于ChatGPT，在157个国家地区的苹果应用商店下载量排名第一。我们认为，DeepSeek出圈背后的技术创新、工程能力突出，引领全球技术趋势，其降本成果对于端云应用的铺垫作用具备重要意义，建议2025年关注国内模型性能优化背景下的应用层投资机遇。

中金公司认为，DeepSeek V3通过技术创新与工程优化，实现了领先的性价比。其采用自主研发的MoE架构，总参数量达671B，每个token激活37B参数，多维度对标GPT-4。技术突破包括稀疏专家模型MoE、多头注意力机制MLA和创新训练目标MTP，显著提升推理效率。此外，FP8混合精度训练策略首次大规模应用，兼顾稳定性和性价比，训练成本仅为557万美元，耗时不到两个月。V3的API定价低至百万输入tokens 0.5元，大幅降低使用成本，中金公司认为有望推动大模型应用端广泛普及。

DeepSeek R1系列通过强化学习（RL）实现了推理能力边际突破。R1 Zero跳过了传统的大规模监督微调（SFT）环节，直接通过强化学习训练基础模型，达到比肩OpenAI GPT-4的能力，验证了RL在大语言模型中的应用潜力。R1在R1 zero的基础上进一步优化算法，解决了语言一致性等问题。通过底层优化了Nvidia的PTX指令集，R1系列提高了跨平台兼容性，并为国产芯片适配提供了可能。R1的高效推理和低成本使其在产业应用中潜力释放，中金公司认为有望进一步推动AI应用的普及与规模化。

DeepSeek Janus-Pro模型在图像理解和生成方面表现出色，实现架构统一。Janus-Pro通过两个编码器分别负责图像理解和生成，共享一个Transformer网络，并采用了三阶段训练优化以提高模型对真实场景的适应能力，模型效果优于Dalle 3等海外成果。

中金公司认为Deepseek将带来三方面产业影响。1）数据从“规模驱动”向“质量优先”转变；2）蒸馏技术带动轻量化模型满足高性能、高效率，使大规模端侧部署更进一步；3）国内外大厂追随，有望迎来技术平权，工程化能力和生态系统建设仍是企业构建竞争壁垒的关键要素。

（文章来源：大河财立方）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。