AI导读:

DeepSeek新发布的多模态大模型Janus-Pro在基准测试中表现卓越,击败OpenAI竞品。同时,美股芯片股受DeepSeek新模型影响全线暴跌,英伟达市值蒸发近4.27万亿元。

近日,国产大模型DeepSeek在人工智能领域掀起波澜,备受业界瞩目。

据人工智能社区Hugging Face于1月28日发布的信息显示,DeepSeek推出了开源多模态人工智能(AI)模型Janus-Pro。在GenEval和DPG-Bench两大基准测试中,Janus-Pro-7B版本凭借其卓越表现,成功击败了OpenAI的DALL-E 3和Stable Diffusion等强劲对手,彰显了其强大的技术实力。

然而,就在发布这一喜讯的同时,DeepSeek也面临了线上服务的挑战。从昨晚至今日凌晨,DeepSeek官方服务状态发布声明称,近期其线上服务遭受了大规模恶意攻击,导致注册功能可能出现繁忙情况。对此,DeepSeek呼吁用户稍作等待并重试,同时表示已注册用户可正常登录,感谢用户的理解和支持。

DeepSeek新发布的Janus-Pro多模态大模型,在图像生成方面展现出了非凡的性能。根据DeepSeek的展示图,Janus-Pro-7B在文生图GenEval和DPG-Bench基准测试中的准确率分别为80%和84.2%,相较于前代Janus的61%和79.7%有了显著提升,并且高于包括OpenAI DALL-E 3在内的其他对比模型。此外,在部分文生图基准测试中,Janus-Pro的70亿参数模型表现甚至优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion 3-Medium等竞品。

据悉,Janus-Pro采用了新颖的自回归框架,实现了多模态理解和生成的统一。通过将视觉编码分离为“理解”和“生成”两条路径,并采用单一的Transformer架构进行处理,Janus-Pro成功解决了以往方法的局限性。这种创新性的分离设计不仅缓解了视觉编码器在理解和生成中的角色冲突,还极大地提升了框架的灵活性。

作为一款统一理解与生成的多模态大语言模型(MLLM),Janus-Pro构建于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基础之上。在多模态理解方面,它使用SigLIP-L作为视觉编码器,支持384x384的图像输入;在图像生成方面,则使用了来源于此的分词器,其下采样率为16。这些先进的技术特性使得Janus-Pro在图像生成领域取得了显著的成果。

另一方面,在股市方面,北京时间1月28日,美股三大指数收盘涨跌互现。道指上涨0.65%,而标普500指数和纳指则分别下跌1.46%和3.07%,纳指更是重挫超600点。大型科技股的股价也呈现分化态势。其中,英伟达股价大幅下跌16.86%,创下历史上最大单日个股市值蒸发纪录,市值蒸发约5888.62亿美元(约合人民币4.27万亿元)。这一跌幅引发了市场对科技AI巨头估值的担忧。

与此同时,美股半导体芯片板块也遭遇了全线暴跌。博通、台积电、美国科技、Arm Holdings、AMD和阿斯麦等芯片股均大幅下跌。分析人士指出,DeepSeek新模型的推出对美股芯片股产生了较大的冲击。DeepSeek在有限的硬件资源下实现了顶尖的模型性能,减少了对高端GPU的依赖,低廉的训练成本预示着AI大模型对算力投入的需求将大幅下降。这一趋势使得市场对芯片股的需求预期降低,从而导致了股价的大幅下跌。

值得一提的是,尽管英伟达等芯片股股价大跌,但苹果股价却逆势上涨3.25%,截至收盘市值达到3.5万亿美元,再度成为全球市值最高的上市公司。这一表现与芯片股形成了鲜明的对比。

综上所述,DeepSeek新模型的推出不仅引发了业界对AI技术发展的关注,也对股市产生了较大的影响。未来,随着AI技术的不断发展和应用领域的不断拓展,其对股市的影响也将更加深远。

每日经济新闻综合报道,免责声明:本文内容与数据仅供参考,不构成投资建议。使用前请核实相关信息,据此操作风险自担。

(文章来源:每日经济新闻)