AI导读:

DeepSeek大模型DeepSeek-R1发布后迅速走红,海外市场热情高涨,多位行业领袖表达赞美。其技术实力获全球赞誉,展现了中国AI产业的创新活力和动力。

每一次AI大模型的迭代进展都能引起市场的广泛关注,而这一次,中国企业“技惊四座”,再次成为了市场焦点。

1月26日,网络上出现消息称,DeepSeek服务器繁忙,疑似崩溃。对此,DeepSeek迅速回应,确认出现了局部服务波动,但问题已在极短时间内得到解决。据推测,此次事件可能与新模型发布后访问量激增有关。值得注意的是,截至1月26日16时30分,DeepSeek在苹果应用商店免费榜的排名已飙升至第四位,仅次于字节跳动旗下的AI助手豆包,展现了其强大的市场吸引力。

一夜之间,“名不见经传”的DeepSeek迅速走红,成为了市场热议的话题。这一切的源头,是一款名为DeepSeek-R1的大模型。

据公开资料显示,DeepSeek的开发者为杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)。该公司成立于2023年7月,致力于探索AGI(通用人工智能)的本质。今年1月20日,深度求索正式发布DeepSeek-R1大模型,并同步开源模型权重。该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。据深度求索发布的信息显示,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能,已比肩OpenAI GPT-4正式版。

DeepSeek-R1的发布,首先点燃了海外市场的热情。在美国硅谷,多位人工智能行业意见领袖对DeepSeek-R1表达了由衷的赞美。微软CEO萨蒂亚·纳德拉公开称赞其推理计算表现出色,且超级计算效率极高。曾投资过OpenAI的投资人马克·安德里森也在社交平台表示,DeepSeek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。在欧洲市场,DeepSeek-R1同样好评如潮。

从各类观点来看,DeepSeek-R1之所以能够快速“出圈”,关键在于其强大的技术实力。据悉,DeepSeek曾在2024年12月底推出了一款免费的开源大型语言模型,该模型的开发仅用了两个月的时间,花费不到600万美元就构建完成,且仅使用了英伟达的低性能芯片H800s。而此次新推出的DeepSeek-R1,在性能上更是比肩OpenAI GPT-4正式版。在第三方大模型测评中,DeepSeek-R1在风格控制类模型这一评价指标上与OpenAI GPT-4并列第一,展现了其卓越的性能。

DeepSeek-R1的出色表现,也引起了国内外科技巨头的关注。据报道,Meta的生成式AI部门正处于恐慌中,工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。这无疑进一步证明了DeepSeek-R1的技术实力和市场影响力。

深度求索在官方微信号中表示,他们投身于探索AGI的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题。他们的努力和创新精神,为中国AI产业的发展注入了新的活力和动力。

(文章来源:证券日报,有删改)