AI导读:

DeepSeek公司遭遇大规模恶意攻击,同时发布新款AI模型R1及多模态框架Janus-Pro和JanusFlow,引发全球科技股市值暴跌和业界广泛关注。

2025年1月28日凌晨,国内领先的AI大模型公司DeepSeek突发公告,称其线上服务正遭受大规模恶意攻击,引发业界广泛关注。

DeepSeek官网公告:遭遇大规模恶意攻击

据DeepSeek官网服务状态页面显示:“近期,我司线上服务不幸遭遇大规模恶意攻击,导致注册功能可能暂时繁忙,敬请用户耐心等待并尝试重试。对于已注册用户,服务依然正常开放,我们衷心感谢大家的理解与支持。”

此前,DeepSeek于1月20日推出了其最新的AI模型R1,该模型专为解决复杂问题而设计,一经推出便在海内外引起热烈反响,服务需求急剧上升。DeepSeek方面表示,其最新的AI模型在功能上可与OpenAI的ChatGPT相媲美,且开发成本远低于同类竞争产品。

然而,此次DeepSeek AI模型的更新不仅引发了业界的广泛关注,更在资本市场掀起了轩然大波。据报道,美国和欧洲科技股市值因此次事件蒸发超过1万亿美元,投资者开始对美国一些大公司的估值产生质疑。

全球科技股市场也随之下跌,其中英伟达股价暴跌15%,纳斯达克指数更是暴跌超过3%。除英伟达外,其他芯片股也普遍暴跌,如博通公司暴跌近17%,台积电暴跌14%,阿斯麦暴跌超6%。

分析人士指出,DeepSeek推出的低成本人工智能模型可能对科技股的估值体系产生深远影响,使得原本支撑牛市的科技估值面临挑战。

Murphy & Sylvest财富管理公司的保罗·诺尔特(Paul Nolte)表示:“尽管我们尚不清楚这是否标志着股票市场的‘斯普特尼克时刻’,但这无疑是一个警钟。它提醒我们,市场上并非只有我们一家玩家。将极高的估值赋予这些股票,并认为它们垄断了市场,这是一个巨大的错误。现在,这些估值正在被市场重新评估。”

对于Miller Tabak的马特·马利(Matt Maley)而言,DeepSeek最新的人工智能模型不仅更具成本效益,而且能够在技术要求较低的芯片上运行。这引发了他对人工智能热潮能带来多大收益的严重质疑。

DeepSeek再推新品:两款多模态框架震撼发布

就在美国科技股暴跌之际,DeepSeek团队于当地时间1月27日正式发布了两款多模态框架——Janus-Pro和JanusFlow。其中,Janus-Pro是一款创新性的统一多模态理解与生成框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能。

而JanusFlow则是一款通过生成流(Rectified Flow)与自回归语言模型融合实现的统一框架。它不仅在理解任务中表现出色,还能生成高质量图像,展现了框架设计的极简与强大。

北京时间1月28日凌晨,人工智能社区Hugging Face显示,DeepSeek已发布了开源多模态人工智能模型Janus-Pro。其中,Janus-Pro-7B在GenEval和DPG-Bench基准测试中成功击败了OpenAI的DALL-E 3和Stable Diffusion。

据页面介绍,Janus-Pro是一种新颖的自回归框架,它统一了多模态的理解与生成。通过将视觉编码分离为独立的路径,Janus-Pro解决了以往方法的局限性,同时依然采用单一的统一Transformer架构进行处理。这种视觉编码的分离不仅缓解了视觉编码器在理解与生成任务中的角色冲突,还显著提升了框架的灵活性。

Janus-Pro不仅超越了之前的统一模型,还能匹配或超越任务专用模型的性能。其简单性、高灵活性以及高效性使Janus-Pro成为下一代统一多模态模型的有力候选者。

作为一款统一理解与生成的多模态大语言模型(MLLM),Janus-Pro通过对多模态理解与生成的视觉编码进行解耦来实现其功能。它构建于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基础之上,在多模态理解和图像生成方面均展现出卓越的性能。

(文章来源:中国基金报,数据和信息仅供参考,不构成任何投资建议。)