英伟达DeepSeek-R1模型引领AI推理新时代

财经聚焦 2025-01-31 12:47:16 来源：券商中国作者：网络

AI导读：

英伟达发布6710亿参数的DeepSeek-R1模型，作为NVIDIA NIM微服务预览版，助力开发者安全测试与构建专属代理。该模型通过多次推理生成最优解，展现了卓越的推理能力和效率，引领AI推理新时代。

英伟达正式认可！DeepSeek-R1模型引领AI推理新时代

据英伟达官方网站最新发布，为了助力开发者安全地测试与构建专属代理功能，拥有6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版，在Build.nvidia.com平台上正式亮相。该微服务在单个NVIDIA HGX H200系统上，每秒能处理高达3872个令牌，极大地提升了处理效率。开发者可通过应用程序编程接口（API）进行探索与实验，这一接口预计很快将以可下载NIM微服务的形式推出，成为NVIDIA AI Enterprise软件平台的重要组成部分。

英伟达强调，DeepSeek-R1作为一款具备前沿推理能力的开放模型，不会直接给出答案，而是通过多次推理，结合思路链、共识及搜索方法，生成最优解。这一过程被称为测试时间扩展，DeepSeek-R1正是这一扩展定律的杰出代表，凸显了加速计算在代理AI推理中的关键作用。

来自巨头的肯定

DeepSeek-R1通过反复“思考”问题，创造出更多输出标记和更长的生成周期，从而不断提升模型质量。大规模测试时计算对于实现实时推理及提高DeepSeek-R1等推理模型的响应质量至关重要，这要求更大规模的推理部署。DeepSeek-R1在逻辑推理、数学、编码和语言理解等任务中展现出卓越的准确性，同时保持了高效率。

为了支持开发者，英伟达将DeepSeek-R1模型作为NIM微服务预览版提供，并利用行业标准API简化了部署流程。企业可在首选加速计算基础设施上运行NIM微服务，确保数据安全与隐私。借助NVIDIA AI Foundry和NVIDIA NeMo软件，企业还能为特定AI代理定制DeepSeek-R1 NIM微服务。

DeepSeek-R1作为一款大型混合专家(MoE)模型，拥有令人瞩目的6710亿个参数，支持长达128000个Token的输入上下文长度，并在每一层中使用了大量专家进行评估。为了提供实时答案，需要高性能GPU支持，并通过高带宽和低延迟通信连接，以将提示令牌路由到所有专家进行推理。结合NVIDIA NIM微服务中的软件优化，一台配备八个H200 GPU并使用NVLink和NVLink Switch连接的服务器，能以每秒高达3872个令牌的速度运行完整的6710亿参数DeepSeek-R1模型。

英伟达还透露，下一代Blackwell架构将通过第五代Tensor Core大幅提升DeepSeek-R1等推理模型的测试时间扩展能力，提供高达20 petaflops的峰值FP4计算性能，以及专为推理优化的72-GPU NVLink域。

从开源到复制

近期，加州大学伯克利分校的研究人员成功开发出中国AI语言模型DeepSeek R1-Zero的小规模复制品TinyZero，成本仅约30美元。该项目由研究生Jiayi Pan领导，并得到教授Alane Suhr和伊利诺伊大学厄巴纳-香槟分校助理教授Hao Peng的指导。DeepSeek的R1模型权重和代码库采用公共MIT许可证，使得Pan及其团队能够访问基础代码，训练出更小的模型。TinyZero同样开源，允许公众下载、训练和修改。

此外，微软官网宣布，DeepSeek R1已加入Azure AI Foundry和GitHub模型目录，成为1800多个多样化AI模型中的一员。作为Azure AI Foundry的一部分，DeepSeek R1可在可靠、可扩展且企业级就绪的平台上访问，助力企业无缝集成高级AI，同时满足SLA、安全性和负责任的AI承诺。

业界反应各异

随着DeepSeek的意外崛起，硅谷、华盛顿、华尔街等地的领导人陷入混乱。部分分析师认为，DeepSeek的成功动摇了美国人工智能行业发展的核心信念。然而，人工智能科学家反驳称，尽管DeepSeek代表了人工智能效率的真正进步，但美国在该领域仍具有关键优势。兰德公司人工智能研究员伦纳特·海姆表示：“这并非人工智能前沿能力的飞跃，市场可能误解了。”

私募股权巨头黑石集团对DeepSeek的崛起持乐观态度。黑石总裁乔纳森·格雷在第四季度财报电话会议上表示，尽管AI模型的使用方式可能会发生变化，但实体基础设施、数据中心和电力的需求依然迫切。黑石集团近年来积极购买和建设数据中心，以满足科技公司运行人工智能系统的需求。

格雷预计，随着人工智能计算能力成本的大幅下降，AI将得到更广泛的应用。尽管AI模型回答特定问题所需的能力可能会减少，但人们会提出更多问题。黑石集团只为签订长期租约的科技公司建造数据中心，并指出客户使用这些数据中心的方式很可能会改变。

（文章来源：券商中国，经重新编辑与优化，以符合SEO要求）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。