DeepSeek AI模型引爆全球，A股市场相关企业受关注

商业视界 2025-01-26 12:19:30 来源：财联社作者：网络

AI导读：

幻方量化旗下AI公司DeepSeek因DeepSeek-V3模型在基准测试中超越Llama 4而一夜爆红，引发美国股市担忧。DeepSeek训练效率高，推理成本低，有望推动AI应用普及。A股市场中与DeepSeek相关的公司受到市场关注。

幻方量化旗下的AI新锐DeepSeek一夜之间红遍全球，不仅在美国各大主流媒体上占据头条，更是在社交网站上掀起热议狂潮。

1月24日，一条在匿名职场交流平台teamblind上发布的帖子迅速走红。一名自称Meta员工的网友爆料称，DeepSeek的最新模型DeepSeek-V3在基准测试中力压Llama 4，让Meta内部陷入恐慌。更令人震惊的是，这一突破性成果竟是由一家‘仅用550万美元训练预算的中国公司’实现的。

甚至有市场观察者将英伟达周五股价下跌归咎于DeepSeek的崛起。德国《世界报》知名市场评论员Holger Zschaepitz指出：‘中国的DeepSeek可能对美国股市构成最大威胁，因为它似乎以极低的成本构建了一个具有突破性的AI模型，而且无需依赖尖端芯片。这引发了人们对数千亿美元资本支出实际效果的质疑。’

据悉，DeepSeek仅使用2048块H800显卡，在短短两个月内就训练出了拥有6710亿参数的DeepSeek-V3模型。相比之下，Meta的Llama 3模型拥有4050亿参数，却使用了16384块更强大的H100显卡，耗时54天。DeepSeek的训练效率因此提升了惊人的11倍。

近期，DeepSeek更是捷报频传。1月20日，DeepSeek发布了DeepSeek-R1模型，并同步开源了模型权重。DeepSeek-R1在后训练阶段大规模应用了强化学习技术，在标注数据极少的情况下，显著提升了模型的推理能力。在数学、代码、自然语言推理等任务上，其性能已可与OpenAI的GPT-4正式版相媲美。1月25日，AMD宣布已将DeepSeek-V3模型集成到Instinct MI300X GPU上，旨在与SGLang协同实现最佳性能。

中信证券的研究报告指出，DeepSeek模型相较于GPT-4模型，其参数量更小，意味着推理成本更低。推理成本的降低将是AI应用普及的重要前提，正如4G网络的提速降费为我国移动互联网产业的蓬勃发展提供了强大助力。随着DeepSeek模型性价比的持续提升，国内AI应用将依托丰富的生态和成熟的流量，加速在各领域的落地应用。其中，Agent模式有望凭借更长的任务流程、更好的场景理解能力和更高的自主能力，成为所有互联网用户的数字助手，在企业管理、教育、办公、金融等多个领域展现出巨大的应用价值。

据财联社不完全统计，目前A股市场中与DeepSeek相关的公司包括：

（文章来源：财联社）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。