DeepSeek发布多模态大模型Janus-Pro，引发“DeepSeek冲击”

国内财经 2025-01-29 07:00:32 来源：上观新闻作者：网络

AI导读：

DeepSeek在一个月内连续发布三款大模型，最新多模态大模型Janus-Pro引发业界热议。同时，其高性价比的算力解决方案对英伟达等传统芯片巨头造成巨大冲击，被媒体称为“DeepSeek冲击”。

2025年1月28日凌晨，国内AI领域的黑马DeepSeek再度发力，悄然上线了其三款大模型中的最新力作——多模态大模型Janus-Pro。此举不仅在国内AI界掀起了波澜，更在大洋彼岸的华尔街引发了“DeepSeek冲击”，导致英伟达股价暴跌，市值一日之内蒸发近6000亿美元，同时波及美股和日股市场。

DeepSeek再下一城

继大语言模型V3和推理模型R1之后，DeepSeek再次展现其技术实力，无预警地推出了多模态模型Janus-Pro。该模型分为10亿和70亿两个参数规模版本，上线几小时内便在AI社区Hugging Face上引发了热烈讨论。

据DeepSeek公布的技术文档显示，Janus-Pro模型实现了文字和图像的双向识别功能，即AI不仅能看懂图片并用文字进行描述，还能通过文字指令生成图片。这一功能的实现，标志着DeepSeek在多模态理解领域取得了重大突破。

值得一提的是，Janus-Pro并非DeepSeek首次尝试多模态大模型。作为此前发布的JanusFlow的迭代版本，Janus-Pro通过优化训练策略、扩展训练数据，在多模态理解和文本到图像的指令跟踪功能方面均取得了显著进步，同时增强了文本到图像生成的稳定性。

DeepSeek披露的测试结果显示，在文生图GenEval和DPG-Bench基准测试中，Janus-Pro-7B的准确率较前代Janus大幅提高，分别达到了80%和84.2%，这一成绩甚至超过了包括OpenAI DALL-E 3、Stable Diffusion在内的其他对比模型。

多模态模型Janus-Pro在基准测试中的优异表现。

与此同时，国内另一AI巨头通义千问也宣布开源其视觉模型Qwen2.5-VL的多尺寸版本，其中旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军。这一新模型能够更准确地解析图像内容，并支持超1小时的视频理解，进一步提升了AI在视觉理解领域的性能。

“DeepSeek冲击”席卷全球股市

或许DeepSeek自己都未曾预料到，一个月内连续发布三款大模型，竟会对大洋彼岸的华尔街造成如此巨大的冲击。这一事件被媒体广泛报道，并被称为“DeepSeek冲击”。

据分析，DeepSeek-V3的总训练成本仅为557.6万美元，而GPT-4o的成本则高达1亿美元，但两者在效果上却相当。这一性价比极高的算力解决方案，让业界对算力需求有了重新的预估，也引发了市场对英伟达等传统芯片巨头的担忧。

美股时间1月27日收盘，英伟达公司股价大幅下跌16.97%，市值一日之内蒸发近6000亿美元，创下华尔街股票市值单日最大跌幅的纪录。受此影响，其他半导体企业也纷纷下跌，博通下跌17%，AMD下跌6%，微软下跌2%，纳斯达克综合指数更是跌去了3.1%，相当于损失超过1万亿美元。此外，“DeepSeek冲击”还波及了日本股市，爱德万测试、东京电子、瑞萨电子等股票均迎来大跌。

DeepSeek因连续发布大模型而遭遇网络攻击。

不仅如此，“DeepSeek冲击”还蔓延至电力市场。美国联合能源公司股价下跌21%，电力“黑马”Vistra股价更是暴跌29%。与OpenAI密切相关的核裂变反应堆公司Oklo的股价也止涨转跌，一日之内跌去25%。

DeepSeek：真正的“OpenAI”

面对DeepSeek的迅猛发展，图灵奖得主杨立昆将其成功归因于“开放研究和开放源代码的力量”。DeepSeek从创始之初便坚持开源理念，V3、R1以及Janus-Pro等最新大模型均通过技术文档面向所有人公开。

据DeepSeek方面介绍，公司采用MIT许可协议，完全开源且不限制商用。用户无需申请即可随时随地访问这些资源，让每个人都能平等获取知识与信息。例如，DeepSeek-V3不仅开源了模型权重，还支持本地部署。开发者可以根据自己的需求对模型进行定制和优化，甚至将其部署到自己的服务器上，从而完全掌控数据隐私。

相比之下，以“开放”为名的OpenAI却逐渐走向了闭源道路。在GPT-3发布之后，OpenAI限制了对模型的访问权限，仅通过API提供服务。而GPT-4则彻底隐藏了训练数据和模型权重，实现了完全闭源。即便是GPT-2的开源也并非基于MIT许可协议，存在诸多限制。因此，不少业内人士认为，“DeepSeek才是真正的‘OpenAI’。”

DeepSeek的成功不仅体现在大模型能力的赶超上，更在于其对美股市场的冲击以及坚守开源的胜利。这一系列事件从侧面反映出中美在AI全球竞争地位上的悄然变化。正如DeepSeek创始人梁文锋所言：“过去很多年，中国公司习惯了别人做技术创新，然后拿过来做应用变现。现在随着经济发展，中国也要逐步成为贡献者，而不是一直搭便车。”DeepSeek的口号“探索未至之境”，或许正是其追求技术创新和突破的最好阐释。

（文章来源：上观新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。