DeepSeek引领AI新潮流，巨头争相接入强化云业务

财经聚焦 2025-01-31 18:56:13 来源：21世纪经济报道作者：网络

AI导读：

DeepSeek-R1模型服务受到硅谷、华尔街及科技巨头关注，微软、AWS、英伟达等迅速接入，强化自家云业务。AI成本降低成为共识，DeepSeek为AI普及和应用爆发做基础布局，AI领域竞争愈演愈烈。

开年之际，AI领域热闹非凡，DeepSeek的崛起更是激起了业界千层浪。

硅谷与华尔街正就DeepSeek的影响展开激烈辩论，与此同时，科技巨头们已迅速行动，无缝对接DeepSeek-R1模型服务。

微软率先行动，将DeepSeek-R1模型纳入其Azure AI Foundry平台，使开发者能够利用新模型进行测试并构建基于云的应用程序和服务。此外，微软还将R1的精简版本引入“Copilot+PC”，优先为搭载骁龙X芯片、英特尔酷睿Ultra 200V处理器的PC设备提供服务，随后将扩展至搭载AMD Ryzen AI 9的设备。

微软CEO萨蒂亚·纳德拉在财报后的电话会议上赞誉DeepSeek的新模型“确实具有创新性”，并预测其将得到广泛应用。纳德拉强调，仅凭发布最好的新模型并不足够，必须确保其具有成本效益。

尽管微软是OpenAI的深度投资者及合作伙伴，但在产品商业化方面，它依然选择多样化的模型策略。目前，Azure平台上已集成OpenAI的GPT系列、Meta的Llama系列、Mistral的模型，并新增了DeepSeek。

紧随其后，AWS（亚马逊云科技）也宣布用户可在Amazon Bedrock和Amazon SageMaker AI两大服务平台上部署DeepSeek-R1模型。AWS始终秉持“一个模型无法解决所有问题”的理念，因此在平台上集成了第三方和自家的大模型，如今又增添了DeepSeek的模型，以便用户根据需求选择最合适的模型。

从微软和AWS的选择及行动来看，它们都在通过构建更多、更强大的大模型矩阵来强化自身的云业务。当前，云厂商正加大AI转型力度，外界也高度关注AI如何驱动云增长。

微软最新发布的四季度财报显示，营收和利润均超预期增长，但Azure云业务增长低于预期，导致股价当天下跌6.18%至414.99美元/股。2025年，云厂商之间的竞争将更加激烈，焦点依然集中在AI领域。

除互联网大厂外，英伟达也同步上线了搭载DeepSeek-R1的软件服务。英伟达官网显示，DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版提供，开发者可测试和体验该API，未来还将提供可下载的NIM微服务版本。

NIM服务是英伟达在2024年新推出的软件产品，旨在助力AI应用开发。Forrester副总裁兼首席分析师戴鲲曾表示，NIM是一个推理平台，融合了底层的CUDA、对自身和第三方大模型的支持、对主流推理框架和云平台的集成，可加速生成式人工智能模型推理全过程，是NVIDIA企业级AI平台的最后一块拼图。

作为硬件巨头和软件专家的英伟达，拥有自己的B端AI服务平台。NIM微服务主要帮助开发者面向未来创造新的应用，无需从零开始编写代码。因此，英伟达接入DeepSeek-R1也是为了丰富自家平台上的模型选项，并与自家硬件相结合，形成一整套软硬件AI体系。结合NVIDIA AI Foundry和NVIDIA NeMo软件，企业还可定制DeepSeek-R1 NIM微服务，以构建特定领域的AI智能体。

作为推理模型，英伟达在介绍中着重强调了DeepSeek-R1强大的推理能力，并表示推理需要大量的算力支持。DeepSeek-R1采用大规模专家混合（MoE）架构，参数规模高达6710亿，是许多流行开源大模型的10倍。其输入上下文长度可达128000个Token，每层拥有256个专家（Experts），每个Token会被并行路由至8个不同的专家进行推理计算。

要实现R1的实时推理，需要大量高算力GPU，并依赖高带宽、低延迟的通信能力，将输入Token高效路由至所有专家进行推理。结合NVIDIA NIM微服务的优化，一个配备8块H200 GPU并通过NVLink和NVLink Switch互联的服务器，即可运行完整的6710亿参数DeepSeek-R1模型，实现高达3872 Token/秒的推理吞吐量。

对于英伟达、AWS和微软这三大巨头而言，能够实际应用的模型就是好模型。它们迅速接入DeepSeek模型，一方面是对DeepSeek能力的认可，另一方面也反映了AI成本降低的共识。大家都在为AI的普及和应用爆发做更多基础布局。

自去年以来，业界大佬就不断强调成本下降的观点，但各有其逻辑。英伟达认为AI推理成本下降主要基于算力效率的提高。现在，DeepSeek从算法角度提供了新的解题思路，通过工程创新提高训练和推理效率，进一步降低成本。

同时，DeepSeek也给OpenAI、Anthropic这两大闭源代表带来了更大的竞争压力。这两家AI明星企业已聚集了巨额资本，2024年均获得了大额融资。近日，Anthropic CEO发文要求加强出口管制；OpenAI也动作频频，不仅突然宣布“o3”模型将在周五公布，还有融资传闻流出。

据媒体报道，OpenAI正以3000亿美元的估值寻求新一轮400亿美元的融资。还有报道称，软银此番计划最多向OpenAI投资250亿美元。这与不久前推出的Stargate（星际之门）计划相呼应。

可以预见，AI赛场上的竞争将愈演愈烈，DeepSeek刮起的旋风还将持续。表面上看，DeepSeek是一家小型初创企业，但其背后的幻方量化已成长近十年，公司招募的多是外界眼中的“天才少年”，精悍的团队让DeepSeek的叙事席卷全球。

人才依然是创新的基石，AI继续吸引着全球最聪明的头脑和最顶尖的人才投身其中。DeepSeek的“黑神话”拉开了AI新篇章，这或许是一个新起点。在AI开源世界中，更多的DeepSeek正在孕育中。同时，也让这场围绕DeepSeek、成本、AI泡沫、开源闭源的探讨更加深入和明晰。

（文章来源：21世纪经济报道）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。