DeepSeek模型爆火,AI领域迎来新变革
AI导读:
DeepSeek模型一夜爆火,美国主流媒体和社交网站广泛报道。Meta内部因DeepSeek-V3模型陷入恐慌,AMD宣布集成DeepSeek-V3模型。中信证券研报指出,DeepSeek模型推理成本降低将推动AI应用普及,国内AI应用加速落地。相关上市公司每日互动和航锦科技涉及AI领域。
近日,幻方量化旗下的AI公司DeepSeek迅速走红,其影响力席卷了美国各大主流媒体及社交网络平台。1月24日,一条在匿名职场交流平台teamblind上发布的帖子迅速传播开来。一名自称Meta公司的员工透露,Meta内部因DeepSeek推出的最新模型DeepSeek-V3而陷入恐慌状态。该员工表示,DeepSeek-V3在基准测试中表现卓越,甚至令备受瞩目的Llama 4模型黯然失色。更令人惊讶的是,这一成就竟是由一家‘仅用550万美元训练预算的中国公司’所达成。
1月25日,AMD官方宣布,已将最新的DeepSeek-V3模型整合至Instinct MI300X GPU中,旨在与SGLang协同工作,以发挥最佳性能。中信证券的研究报告指出,相较于GPT4模型,DeepSeek模型拥有更少的参数量,这直接导致了更低的推理成本。推理成本的削减被视为AI应用普及的重要前兆,正如4G网络的提速降费为我国移动互联网产业的蓬勃发展提供了强大动力。预计随着DeepSeek模型性价比的持续攀升,国内AI应用将凭借其丰富的生态系统和成熟的流量基础,加速在各个领域内的落地实施。
据财联社主题库数据显示,在相关上市公司中:
每日互动于2024年7月2日在互动易平台上回复称,公司已迅速接入ChatGPT、文心一言、ChatGLM、通义千问以及DeepSeek等国内外领先的通用大模型,并在此基础上成功开发出适用于垂直场景的大模型应用。
航锦科技旗下的控股子公司超擎数智,作为AI领域的佼佼者,能够为客户提供包括AI服务器、GPU、智能网卡/DPU、交换机以及光模块/AOC/DAC在内的整体解决方案。值得注意的是,超擎数智的官方网站显示,幻方量化正是其重要的合作伙伴之一。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。