AI导读:

春节期间,中国国产大模型DeepSeek成为热门话题。DeepSeek-R1一经推出就震撼业界,并登顶苹果应用商店排行榜。开源策略助力AI发展,DeepSeek验证开源模型性能,推动科技巨头加码开源AI。中国AI界需用创新、开放回应封闭挑战。

  在2025年春节假期期间,中国自主研发的国产大模型DeepSeek意外走红,成为科技领域热议的焦点话题。这款大模型的推出,不仅在国内引发了广泛关注,也在国际上产生了重要影响。

  1月20日,中国大模型领域的先锋企业深度求索公司正式推出了其精心研发的推理大模型DeepSeek-R1。该模型一经问世,便以其卓越的性能震撼了整个业界。随后,在1月27日,DeepSeek应用在苹果中国区和美国区应用商店的免费App下载排行榜上成功登顶,进一步彰显了其市场影响力和受欢迎程度。1月31日,英伟达、亚马逊和微软这三大美国科技巨头更是在同一天宣布接入DeepSeek-R1,这无疑是对其技术实力和市场前景的高度认可。

  DeepSeek的成功,不仅标志着AI技术的一次重大突破,也引发了社会各界的广泛讨论。一方面,DeepSeek的性能达到了国际先进水平,展示了中国AI技术的强大实力;另一方面,其高度的可用性和完成度也让AI技术更加贴近普通人的生活和工作,引发了广泛的关注和讨论。

  DeepSeek的成功推出,不仅体现了国产大模型的能力,更有可能推动中国AI技术追赶并反超世界先进水平。同时,DeepSeek还大幅降低了AI模型的训练成本,其R1模型的训练成本仅为557.6万美元,远低于OpenAI的GPT模型高达1亿美元的训练成本。这一优势使得DeepSeek在市场竞争中更具竞争力。

  面对DeepSeek所取得的辉煌成就和广泛赞誉,深度求索(DeepSeek)的创始人梁文锋却表现得十分谦逊。他表示:“我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。”梁文锋所提到的“巨人”——开源社区(Open Source),正是DeepSeek能够取得如此成就的重要基石。

  开源社区以其开放源代码的理念,吸引了全球范围内的开发者和研究者共同参与技术研究和创新。这种开放、协作的模式不仅提高了技术创新的效率和质量,也推动了AI技术的迅猛发展。Meta首席人工智能科学家、2018年图灵奖得主杨立昆在评价DeepSeek时就指出:“与其说是中国在人工智能上超越美国,正确的看法应该是开源代码正在超越私有模式。”

  事实上,Meta正是推动AI大模型开源的重要力量之一。从LLaMA到大模型Segment-Anything,Meta开源的项目覆盖了各种模态和场景,为AI技术的发展注入了强大的动力。其中,LLaMA更是被誉为最强大的开源大模型之一。而DeepSeek正是在这样的开源生态中不断成长和壮大起来的。

  DeepSeek的成功不仅验证了开源模型可接近闭源性能的可能性,也进一步推动了Meta等科技巨头加码开源AI。最近,Meta又开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM等,这些项目的推出进一步提升了AI在图像处理和语音识别领域的能力。

  然而,在开源促进AI迅猛发展的同时,我们也应该看到其中存在的隐忧。随着硬件逐渐走向封闭,软件的开源是否也会面临同样的风险?这是一个值得中国AI界深思的问题。正如DeepSeek选择开源自己的大模型一样,我们应该用创新、开放的态度去回应封闭的挑战,共同推动AI技术的持续发展和进步。

(文章来源:南方都市报,作者:刘远举)

DeepSeek大模型相关图片