AI导读:

DeepSeek在一个月内连续发布三款大模型,最新多模态大模型Janus-Pro引发业界热议。同时,其高性价比的算力解决方案对英伟达等传统芯片巨头造成巨大冲击,被媒体称为“DeepSeek冲击”。

2025年1月28日凌晨,国内AI领域的黑马DeepSeek再度发力,悄然上线了其三款大模型中的最新力作——多模态大模型Janus-Pro。此举不仅在国内AI界掀起了波澜,更在大洋彼岸的华尔街引发了“DeepSeek冲击”,导致英伟达股价暴跌,市值一日之内蒸发近6000亿美元,同时波及美股和日股市场。

DeepSeek再下一城

继大语言模型V3和推理模型R1之后,DeepSeek再次展现其技术实力,无预警地推出了多模态模型Janus-Pro。该模型分为10亿和70亿两个参数规模版本,上线几小时内便在AI社区Hugging Face上引发了热烈讨论。

据DeepSeek公布的技术文档显示,Janus-Pro模型实现了文字和图像的双向识别功能,即AI不仅能看懂图片并用文字进行描述,还能通过文字指令生成图片。这一功能的实现,标志着DeepSeek在多模态理解领域取得了重大突破。

值得一提的是,Janus-Pro并非DeepSeek首次尝试多模态大模型。作为此前发布的JanusFlow的迭代版本,Janus-Pro通过优化训练策略、扩展训练数据,在多模态理解和文本到图像的指令跟踪功能方面均取得了显著进步,同时增强了文本到图像生成的稳定性。

DeepSeek披露的测试结果显示,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,分别达到了80%和84.2%,这一成绩甚至超过了包括OpenAI DALL-E 3、Stable Diffusion在内的其他对比模型。

多模态模型Janus-Pro在基准测试中的优异表现。

与此同时,国内另一AI巨头通义千问也宣布开源其视觉模型Qwen2.5-VL的多尺寸版本,其中旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军。这一新模型能够更准确地解析图像内容,并支持超1小时的视频理解,进一步提升了AI在视觉理解领域的性能。

“DeepSeek冲击”席卷全球股市

或许DeepSeek自己都未曾预料到,一个月内连续发布三款大模型,竟会对大洋彼岸的华尔街造成如此巨大的冲击。这一事件被媒体广泛报道,并被称为“DeepSeek冲击”。

据分析,DeepSeek-V3的总训练成本仅为557.6万美元,而GPT-4o的成本则高达1亿美元,但两者在效果上却相当。这一性价比极高的算力解决方案,让业界对算力需求有了重新的预估,也引发了市场对英伟达等传统芯片巨头的担忧。

美股时间1月27日收盘,英伟达公司股价大幅下跌16.97%,市值一日之内蒸发近6000亿美元,创下华尔街股票市值单日最大跌幅的纪录。受此影响,其他半导体企业也纷纷下跌,博通下跌17%,AMD下跌6%,微软下跌2%,纳斯达克综合指数更是跌去了3.1%,相当于损失超过1万亿美元。此外,“DeepSeek冲击”还波及了日本股市,爱德万测试、东京电子、瑞萨电子等股票均迎来大跌。

DeepSeek因连续发布大模型而遭遇网络攻击。

不仅如此,“DeepSeek冲击”还蔓延至电力市场。美国联合能源公司股价下跌21%,电力“黑马”Vistra股价更是暴跌29%。与OpenAI密切相关的核裂变反应堆公司Oklo的股价也止涨转跌,一日之内跌去25%。

DeepSeek:真正的“OpenAI”

面对DeepSeek的迅猛发展,图灵奖得主杨立昆将其成功归因于“开放研究和开放源代码的力量”。DeepSeek从创始之初便坚持开源理念,V3、R1以及Janus-Pro等最新大模型均通过技术文档面向所有人公开。

据DeepSeek方面介绍,公司采用MIT许可协议,完全开源且不限制商用。用户无需申请即可随时随地访问这些资源,让每个人都能平等获取知识与信息。例如,DeepSeek-V3不仅开源了模型权重,还支持本地部署。开发者可以根据自己的需求对模型进行定制和优化,甚至将其部署到自己的服务器上,从而完全掌控数据隐私。

相比之下,以“开放”为名的OpenAI却逐渐走向了闭源道路。在GPT-3发布之后,OpenAI限制了对模型的访问权限,仅通过API提供服务。而GPT-4则彻底隐藏了训练数据和模型权重,实现了完全闭源。即便是GPT-2的开源也并非基于MIT许可协议,存在诸多限制。因此,不少业内人士认为,“DeepSeek才是真正的‘OpenAI’。”

DeepSeek的成功不仅体现在大模型能力的赶超上,更在于其对美股市场的冲击以及坚守开源的胜利。这一系列事件从侧面反映出中美在AI全球竞争地位上的悄然变化。正如DeepSeek创始人梁文锋所言:“过去很多年,中国公司习惯了别人做技术创新,然后拿过来做应用变现。现在随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。”DeepSeek的口号“探索未至之境”,或许正是其追求技术创新和突破的最好阐释。

(文章来源:上观新闻)