DeepSeek引领AI新潮流,巨头争相接入强化云业务
AI导读:
DeepSeek-R1模型服务受到硅谷、华尔街及科技巨头关注,微软、AWS、英伟达等迅速接入,强化自家云业务。AI成本降低成为共识,DeepSeek为AI普及和应用爆发做基础布局,AI领域竞争愈演愈烈。
开年之际,AI领域热闹非凡,DeepSeek的崛起更是激起了业界千层浪。
硅谷与华尔街正就DeepSeek的影响展开激烈辩论,与此同时,科技巨头们已迅速行动,无缝对接DeepSeek-R1模型服务。
微软率先行动,将DeepSeek-R1模型纳入其Azure AI Foundry平台,使开发者能够利用新模型进行测试并构建基于云的应用程序和服务。此外,微软还将R1的精简版本引入“Copilot+PC”,优先为搭载骁龙X芯片、英特尔酷睿Ultra 200V处理器的PC设备提供服务,随后将扩展至搭载AMD Ryzen AI 9的设备。
微软CEO萨蒂亚·纳德拉在财报后的电话会议上赞誉DeepSeek的新模型“确实具有创新性”,并预测其将得到广泛应用。纳德拉强调,仅凭发布最好的新模型并不足够,必须确保其具有成本效益。
尽管微软是OpenAI的深度投资者及合作伙伴,但在产品商业化方面,它依然选择多样化的模型策略。目前,Azure平台上已集成OpenAI的GPT系列、Meta的Llama系列、Mistral的模型,并新增了DeepSeek。
紧随其后,AWS(亚马逊云科技)也宣布用户可在Amazon Bedrock和Amazon SageMaker AI两大服务平台上部署DeepSeek-R1模型。AWS始终秉持“一个模型无法解决所有问题”的理念,因此在平台上集成了第三方和自家的大模型,如今又增添了DeepSeek的模型,以便用户根据需求选择最合适的模型。
从微软和AWS的选择及行动来看,它们都在通过构建更多、更强大的大模型矩阵来强化自身的云业务。当前,云厂商正加大AI转型力度,外界也高度关注AI如何驱动云增长。
微软最新发布的四季度财报显示,营收和利润均超预期增长,但Azure云业务增长低于预期,导致股价当天下跌6.18%至414.99美元/股。2025年,云厂商之间的竞争将更加激烈,焦点依然集中在AI领域。
除互联网大厂外,英伟达也同步上线了搭载DeepSeek-R1的软件服务。英伟达官网显示,DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版提供,开发者可测试和体验该API,未来还将提供可下载的NIM微服务版本。
NIM服务是英伟达在2024年新推出的软件产品,旨在助力AI应用开发。Forrester副总裁兼首席分析师戴鲲曾表示,NIM是一个推理平台,融合了底层的CUDA、对自身和第三方大模型的支持、对主流推理框架和云平台的集成,可加速生成式人工智能模型推理全过程,是NVIDIA企业级AI平台的最后一块拼图。
作为硬件巨头和软件专家的英伟达,拥有自己的B端AI服务平台。NIM微服务主要帮助开发者面向未来创造新的应用,无需从零开始编写代码。因此,英伟达接入DeepSeek-R1也是为了丰富自家平台上的模型选项,并与自家硬件相结合,形成一整套软硬件AI体系。结合NVIDIA AI Foundry和NVIDIA NeMo软件,企业还可定制DeepSeek-R1 NIM微服务,以构建特定领域的AI智能体。
作为推理模型,英伟达在介绍中着重强调了DeepSeek-R1强大的推理能力,并表示推理需要大量的算力支持。DeepSeek-R1采用大规模专家混合(MoE)架构,参数规模高达6710亿,是许多流行开源大模型的10倍。其输入上下文长度可达128000个Token,每层拥有256个专家(Experts),每个Token会被并行路由至8个不同的专家进行推理计算。
要实现R1的实时推理,需要大量高算力GPU,并依赖高带宽、低延迟的通信能力,将输入Token高效路由至所有专家进行推理。结合NVIDIA NIM微服务的优化,一个配备8块H200 GPU并通过NVLink和NVLink Switch互联的服务器,即可运行完整的6710亿参数DeepSeek-R1模型,实现高达3872 Token/秒的推理吞吐量。
对于英伟达、AWS和微软这三大巨头而言,能够实际应用的模型就是好模型。它们迅速接入DeepSeek模型,一方面是对DeepSeek能力的认可,另一方面也反映了AI成本降低的共识。大家都在为AI的普及和应用爆发做更多基础布局。
自去年以来,业界大佬就不断强调成本下降的观点,但各有其逻辑。英伟达认为AI推理成本下降主要基于算力效率的提高。现在,DeepSeek从算法角度提供了新的解题思路,通过工程创新提高训练和推理效率,进一步降低成本。
同时,DeepSeek也给OpenAI、Anthropic这两大闭源代表带来了更大的竞争压力。这两家AI明星企业已聚集了巨额资本,2024年均获得了大额融资。近日,Anthropic CEO发文要求加强出口管制;OpenAI也动作频频,不仅突然宣布“o3”模型将在周五公布,还有融资传闻流出。
据媒体报道,OpenAI正以3000亿美元的估值寻求新一轮400亿美元的融资。还有报道称,软银此番计划最多向OpenAI投资250亿美元。这与不久前推出的Stargate(星际之门)计划相呼应。
可以预见,AI赛场上的竞争将愈演愈烈,DeepSeek刮起的旋风还将持续。表面上看,DeepSeek是一家小型初创企业,但其背后的幻方量化已成长近十年,公司招募的多是外界眼中的“天才少年”,精悍的团队让DeepSeek的叙事席卷全球。
人才依然是创新的基石,AI继续吸引着全球最聪明的头脑和最顶尖的人才投身其中。DeepSeek的“黑神话”拉开了AI新篇章,这或许是一个新起点。在AI开源世界中,更多的DeepSeek正在孕育中。同时,也让这场围绕DeepSeek、成本、AI泡沫、开源闭源的探讨更加深入和明晰。
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。