英伟达DeepSeek-R1模型引领AI推理新时代
AI导读:
英伟达发布6710亿参数的DeepSeek-R1模型,作为NVIDIA NIM微服务预览版,助力开发者安全测试与构建专属代理。该模型通过多次推理生成最优解,展现了卓越的推理能力和效率,引领AI推理新时代。
英伟达正式认可!DeepSeek-R1模型引领AI推理新时代
据英伟达官方网站最新发布,为了助力开发者安全地测试与构建专属代理功能,拥有6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版,在Build.nvidia.com平台上正式亮相。该微服务在单个NVIDIA HGX H200系统上,每秒能处理高达3872个令牌,极大地提升了处理效率。开发者可通过应用程序编程接口(API)进行探索与实验,这一接口预计很快将以可下载NIM微服务的形式推出,成为NVIDIA AI Enterprise软件平台的重要组成部分。
英伟达强调,DeepSeek-R1作为一款具备前沿推理能力的开放模型,不会直接给出答案,而是通过多次推理,结合思路链、共识及搜索方法,生成最优解。这一过程被称为测试时间扩展,DeepSeek-R1正是这一扩展定律的杰出代表,凸显了加速计算在代理AI推理中的关键作用。
来自巨头的肯定
DeepSeek-R1通过反复“思考”问题,创造出更多输出标记和更长的生成周期,从而不断提升模型质量。大规模测试时计算对于实现实时推理及提高DeepSeek-R1等推理模型的响应质量至关重要,这要求更大规模的推理部署。DeepSeek-R1在逻辑推理、数学、编码和语言理解等任务中展现出卓越的准确性,同时保持了高效率。
为了支持开发者,英伟达将DeepSeek-R1模型作为NIM微服务预览版提供,并利用行业标准API简化了部署流程。企业可在首选加速计算基础设施上运行NIM微服务,确保数据安全与隐私。借助NVIDIA AI Foundry和NVIDIA NeMo软件,企业还能为特定AI代理定制DeepSeek-R1 NIM微服务。
DeepSeek-R1作为一款大型混合专家(MoE)模型,拥有令人瞩目的6710亿个参数,支持长达128000个Token的输入上下文长度,并在每一层中使用了大量专家进行评估。为了提供实时答案,需要高性能GPU支持,并通过高带宽和低延迟通信连接,以将提示令牌路由到所有专家进行推理。结合NVIDIA NIM微服务中的软件优化,一台配备八个H200 GPU并使用NVLink和NVLink Switch连接的服务器,能以每秒高达3872个令牌的速度运行完整的6710亿参数DeepSeek-R1模型。
英伟达还透露,下一代Blackwell架构将通过第五代Tensor Core大幅提升DeepSeek-R1等推理模型的测试时间扩展能力,提供高达20 petaflops的峰值FP4计算性能,以及专为推理优化的72-GPU NVLink域。
从开源到复制
近期,加州大学伯克利分校的研究人员成功开发出中国AI语言模型DeepSeek R1-Zero的小规模复制品TinyZero,成本仅约30美元。该项目由研究生Jiayi Pan领导,并得到教授Alane Suhr和伊利诺伊大学厄巴纳-香槟分校助理教授Hao Peng的指导。DeepSeek的R1模型权重和代码库采用公共MIT许可证,使得Pan及其团队能够访问基础代码,训练出更小的模型。TinyZero同样开源,允许公众下载、训练和修改。
此外,微软官网宣布,DeepSeek R1已加入Azure AI Foundry和GitHub模型目录,成为1800多个多样化AI模型中的一员。作为Azure AI Foundry的一部分,DeepSeek R1可在可靠、可扩展且企业级就绪的平台上访问,助力企业无缝集成高级AI,同时满足SLA、安全性和负责任的AI承诺。
业界反应各异
随着DeepSeek的意外崛起,硅谷、华盛顿、华尔街等地的领导人陷入混乱。部分分析师认为,DeepSeek的成功动摇了美国人工智能行业发展的核心信念。然而,人工智能科学家反驳称,尽管DeepSeek代表了人工智能效率的真正进步,但美国在该领域仍具有关键优势。兰德公司人工智能研究员伦纳特·海姆表示:“这并非人工智能前沿能力的飞跃,市场可能误解了。”
私募股权巨头黑石集团对DeepSeek的崛起持乐观态度。黑石总裁乔纳森·格雷在第四季度财报电话会议上表示,尽管AI模型的使用方式可能会发生变化,但实体基础设施、数据中心和电力的需求依然迫切。黑石集团近年来积极购买和建设数据中心,以满足科技公司运行人工智能系统的需求。
格雷预计,随着人工智能计算能力成本的大幅下降,AI将得到更广泛的应用。尽管AI模型回答特定问题所需的能力可能会减少,但人们会提出更多问题。黑石集团只为签订长期租约的科技公司建造数据中心,并指出客户使用这些数据中心的方式很可能会改变。
(文章来源:券商中国,经重新编辑与优化,以符合SEO要求)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。