DeepSeek遭大规模攻击,AI新模型发布引发科技股市震荡
AI导读:
1月28日凌晨,国内AI大模型公司DeepSeek称遭受大规模恶意攻击,服务受影响。此前DeepSeek推出的AI模型R1引发全球科技股市震荡,随后又发布了新款多模态框架Janus-Pro,进一步加剧了市场波动。
1月28日凌晨,国内领先的AI大模型企业DeepSeek遭遇大规模恶意攻击,引发业界广泛关注!
DeepSeek遭遇前所未有的恶意攻击
据DeepSeek官网服务状态页面显示,近期其线上服务正面临大规模恶意攻击,导致注册功能可能出现繁忙状态,官方建议用户稍后再试。对于已注册用户,服务仍然保持正常登录,并感谢广大用户的理解和支持。
1月20日,DeepSeek正式推出其最新AI模型R1,这款专为解决复杂问题设计的模型,在海外市场获得高度认可后,服务需求急剧上升。DeepSeek声称,其最新AI模型在性能上可与OpenAI的ChatGPT相媲美,且开发成本远低于竞争对手。
此次DeepSeek的更新,对全球科技股市造成了巨大冲击,美国和欧洲科技股市值蒸发超过1万亿美元,投资者开始质疑美国部分科技巨头的估值泡沫。
全球科技股普遍下跌,其中英伟达股价暴跌15%,纳斯达克指数更是暴跌超过3%,该指数以科技股为主。此外,博通公司股价下跌近17%,台积电暴跌14%,阿斯麦也下跌超过6%。
市场分析指出,DeepSeek推出的低成本人工智能模型,可能使原本支撑牛市的科技估值面临挑战,难以持续。
Murphy & Sylvest财富管理公司的保罗·诺尔特(Paul Nolte)评论道:“我们尚不清楚这是否标志着股票市场的‘斯普特尼克时刻’,但这无疑是一个警钟,提醒我们市场并非只有一家独大。将极高的估值赋予这些股票,并认为它们垄断了市场,是一个巨大的错误,现在市场正在对此进行重新评估。”
Miller Tabak的马特·马利(Matt Maley)则认为,DeepSeek最新的人工智能模型更具成本效益,且能在技术要求较低的芯片上运行,这引发了对人工智能热潮真实收益的严重质疑。
DeepSeek再推新品,人工智能领域竞争加剧
当地时间1月27日,DeepSeek团队正式发布了两款多模态框架——Janus-Pro和JanusFlow。Janus-Pro作为一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,显著提升了模型在不同任务中的适配性和性能。
JanusFlow则是一款将生成流(Rectified Flow)与自回归语言模型融合的统一框架,不仅在理解任务中表现出色,还能生成高质量图像,展现了框架设计的极简与强大。
北京时间1月28日凌晨,正值美国科技股暴跌之际,人工智能社区Hugging Face显示,DeepSeek发布了开源多模态人工智能模型Janus-Pro。其中,Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。
据页面显示,Janus-Pro是一种创新的自回归框架,统一了多模态的理解与生成。通过将视觉编码分离为独立路径,解决了以往方法的局限性,同时仍然采用单一的统一Transformer架构进行处理。视觉编码的分离不仅缓解了视觉编码器在理解与生成任务中的角色冲突,还提升了框架的灵活性。Janus-Pro不仅超越了之前的统一模型,还能匹配或超越任务专用模型的性能。其简单性、高灵活性以及高效性,使Janus-Pro成为下一代统一多模态模型的有力竞争者。
Janus-Pro是一款基于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base构建的统一理解与生成的多模态大语言模型(MLLM),通过对多模态理解与生成的视觉编码进行解耦来实现功能。在多模态理解方面,它使用SigLIP-L作为视觉编码器,支持384x384的图像输入;在图像生成方面,则使用了来源于此的分词器,其下采样率为16。
(文章来源:中国基金报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。