DeepSeek AI模型引爆全球,A股市场相关企业受关注
AI导读:
幻方量化旗下AI公司DeepSeek因DeepSeek-V3模型在基准测试中超越Llama 4而一夜爆红,引发美国股市担忧。DeepSeek训练效率高,推理成本低,有望推动AI应用普及。A股市场中与DeepSeek相关的公司受到市场关注。
幻方量化旗下的AI新锐DeepSeek一夜之间红遍全球,不仅在美国各大主流媒体上占据头条,更是在社交网站上掀起热议狂潮。
1月24日,一条在匿名职场交流平台teamblind上发布的帖子迅速走红。一名自称Meta员工的网友爆料称,DeepSeek的最新模型DeepSeek-V3在基准测试中力压Llama 4,让Meta内部陷入恐慌。更令人震惊的是,这一突破性成果竟是由一家‘仅用550万美元训练预算的中国公司’实现的。
甚至有市场观察者将英伟达周五股价下跌归咎于DeepSeek的崛起。德国《世界报》知名市场评论员Holger Zschaepitz指出:‘中国的DeepSeek可能对美国股市构成最大威胁,因为它似乎以极低的成本构建了一个具有突破性的AI模型,而且无需依赖尖端芯片。这引发了人们对数千亿美元资本支出实际效果的质疑。’
据悉,DeepSeek仅使用2048块H800显卡,在短短两个月内就训练出了拥有6710亿参数的DeepSeek-V3模型。相比之下,Meta的Llama 3模型拥有4050亿参数,却使用了16384块更强大的H100显卡,耗时54天。DeepSeek的训练效率因此提升了惊人的11倍。
近期,DeepSeek更是捷报频传。1月20日,DeepSeek发布了DeepSeek-R1模型,并同步开源了模型权重。DeepSeek-R1在后训练阶段大规模应用了强化学习技术,在标注数据极少的情况下,显著提升了模型的推理能力。在数学、代码、自然语言推理等任务上,其性能已可与OpenAI的GPT-4正式版相媲美。1月25日,AMD宣布已将DeepSeek-V3模型集成到Instinct MI300X GPU上,旨在与SGLang协同实现最佳性能。
中信证券的研究报告指出,DeepSeek模型相较于GPT-4模型,其参数量更小,意味着推理成本更低。推理成本的降低将是AI应用普及的重要前提,正如4G网络的提速降费为我国移动互联网产业的蓬勃发展提供了强大助力。随着DeepSeek模型性价比的持续提升,国内AI应用将依托丰富的生态和成熟的流量,加速在各领域的落地应用。其中,Agent模式有望凭借更长的任务流程、更好的场景理解能力和更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等多个领域展现出巨大的应用价值。
据财联社不完全统计,目前A股市场中与DeepSeek相关的公司包括:
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。