AI导读:

英伟达发布6710亿参数的DeepSeek-R1模型,作为NVIDIA NIM微服务预览版,助力开发者安全测试与构建专属代理。该模型通过多次推理生成最优解,展现了卓越的推理能力和效率,引领AI推理新时代。

英伟达正式认可!DeepSeek-R1模型引领AI推理新时代

据英伟达官方网站最新发布,为了助力开发者安全地测试与构建专属代理功能,拥有6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版,在Build.nvidia.com平台上正式亮相。该微服务在单个NVIDIA HGX H200系统上,每秒能处理高达3872个令牌,极大地提升了处理效率。开发者可通过应用程序编程接口(API)进行探索与实验,这一接口预计很快将以可下载NIM微服务的形式推出,成为NVIDIA AI Enterprise软件平台的重要组成部分。

英伟达强调,DeepSeek-R1作为一款具备前沿推理能力的开放模型,不会直接给出答案,而是通过多次推理,结合思路链、共识及搜索方法,生成最优解。这一过程被称为测试时间扩展,DeepSeek-R1正是这一扩展定律的杰出代表,凸显了加速计算在代理AI推理中的关键作用。

来自巨头的肯定

DeepSeek-R1通过反复“思考”问题,创造出更多输出标记和更长的生成周期,从而不断提升模型质量。大规模测试时计算对于实现实时推理及提高DeepSeek-R1等推理模型的响应质量至关重要,这要求更大规模的推理部署。DeepSeek-R1在逻辑推理、数学、编码和语言理解等任务中展现出卓越的准确性,同时保持了高效率。

为了支持开发者,英伟达将DeepSeek-R1模型作为NIM微服务预览版提供,并利用行业标准API简化了部署流程。企业可在首选加速计算基础设施上运行NIM微服务,确保数据安全与隐私。借助NVIDIA AI Foundry和NVIDIA NeMo软件,企业还能为特定AI代理定制DeepSeek-R1 NIM微服务。

DeepSeek-R1作为一款大型混合专家(MoE)模型,拥有令人瞩目的6710亿个参数,支持长达128000个Token的输入上下文长度,并在每一层中使用了大量专家进行评估。为了提供实时答案,需要高性能GPU支持,并通过高带宽和低延迟通信连接,以将提示令牌路由到所有专家进行推理。结合NVIDIA NIM微服务中的软件优化,一台配备八个H200 GPU并使用NVLink和NVLink Switch连接的服务器,能以每秒高达3872个令牌的速度运行完整的6710亿参数DeepSeek-R1模型。

英伟达还透露,下一代Blackwell架构将通过第五代Tensor Core大幅提升DeepSeek-R1等推理模型的测试时间扩展能力,提供高达20 petaflops的峰值FP4计算性能,以及专为推理优化的72-GPU NVLink域。

从开源到复制

近期,加州大学伯克利分校的研究人员成功开发出中国AI语言模型DeepSeek R1-Zero的小规模复制品TinyZero,成本仅约30美元。该项目由研究生Jiayi Pan领导,并得到教授Alane Suhr和伊利诺伊大学厄巴纳-香槟分校助理教授Hao Peng的指导。DeepSeek的R1模型权重和代码库采用公共MIT许可证,使得Pan及其团队能够访问基础代码,训练出更小的模型。TinyZero同样开源,允许公众下载、训练和修改。

此外,微软官网宣布,DeepSeek R1已加入Azure AI Foundry和GitHub模型目录,成为1800多个多样化AI模型中的一员。作为Azure AI Foundry的一部分,DeepSeek R1可在可靠、可扩展且企业级就绪的平台上访问,助力企业无缝集成高级AI,同时满足SLA、安全性和负责任的AI承诺。

业界反应各异

随着DeepSeek的意外崛起,硅谷、华盛顿、华尔街等地的领导人陷入混乱。部分分析师认为,DeepSeek的成功动摇了美国人工智能行业发展的核心信念。然而,人工智能科学家反驳称,尽管DeepSeek代表了人工智能效率的真正进步,但美国在该领域仍具有关键优势。兰德公司人工智能研究员伦纳特·海姆表示:“这并非人工智能前沿能力的飞跃,市场可能误解了。”

私募股权巨头黑石集团对DeepSeek的崛起持乐观态度。黑石总裁乔纳森·格雷在第四季度财报电话会议上表示,尽管AI模型的使用方式可能会发生变化,但实体基础设施、数据中心和电力的需求依然迫切。黑石集团近年来积极购买和建设数据中心,以满足科技公司运行人工智能系统的需求。

格雷预计,随着人工智能计算能力成本的大幅下降,AI将得到更广泛的应用。尽管AI模型回答特定问题所需的能力可能会减少,但人们会提出更多问题。黑石集团只为签订长期租约的科技公司建造数据中心,并指出客户使用这些数据中心的方式很可能会改变。

(文章来源:券商中国,经重新编辑与优化,以符合SEO要求)