AI导读:

DeepSeek发布Janus-Pro多模态模型,在文生图能力方面取得突破,击败顶尖图像生成模型。引发华尔街对美国公司模型成本的质疑和人工智能股票泡沫破裂的恐慌,导致美股科技股抛售潮。

AI永不眠,其影响正在全球资本市场上掀起波澜。近日,DeepSeek公司发布的R1大语言模型,不仅引发了华尔街对美国公司模型成本的广泛质疑,还触发了人工智能股票泡沫可能破裂的恐慌情绪,导致美股市场上科技股遭遇抛售狂潮。

芯片巨头英伟达在这场风暴中首当其冲,当日收盘股价暴跌约16.86%,单日市值惊人地蒸发了约600亿美元。与此同时,博通下跌17.4%,超威半导体公司下滑6.37%,美光科技下跌11.67%,台积电更是重挫13.23%。此外,微软也未能幸免,股价下跌2.14%。人工智能领域的衍生品同样受到冲击,电力供应商美国联合能源公司和Vistra的股价分别下跌20.85%和28.33%。

白宫人工智能和加密货币总管David Sacks在社交平台X上发帖评论称,DeepSeek R1的表现预示着人工智能领域的竞争将异常激烈,并认为美国总统特朗普废除拜登关于人工智能的行政命令是正确的决定。Sacks批评拜登的行政命令束缚了美国的人工智能公司发展,并强调:“我对美国充满信心,但我们绝不能自满。”

在R1模型震撼硅谷并给华尔街带来重创后,DeepSeek又在深夜放出了大招。1月27日晚间10点左右,DeepSeek创始人梁文锋在社交平台X上预告,DeepSeek新版本即将发布。仅仅三个多小时后,人工智能开源社区HuggingFace就宣布,DeepSeek发布了一系列名为Janus-Pro和JanusFlow的开源多模态模型,参数大小从10亿到70亿不等。

本次发布的新模型在文生图能力方面取得了显著突破。其中,70亿参数的Janus-Pro-7B在GenEval和DPG-Bench基准测试中,分别以80%和84.2%的准确率测试结果,击败了OpenAI的DALL-E3和StableDiffusion等顶尖图像生成模型。该项目采用MIT许可证开源,开发者可以通过GitHub获取完整代码。DeepSeek团队表示,Janus-Pro凭借其简洁设计和卓越性能,有望成为下一代统一多模态模型的重要选择。

据DeepSeek发布的报告介绍,Janus-Pro是此前发布的Janus模型的改进版。相较于Janus,Janus-Pro采用了优化的训练策略、扩展的训练数据,并扩展到更大的模型规模。这些改进使得Janus-Pro在多模态理解和文本到图像指令跟随能力方面取得了显著进步,同时提升了文本到图像生成的稳定性。

具体来说,Janus-Pro作为一种新颖的自回归框架,将多模态理解和生成统一起来,通过解耦视觉编码来实现多模态理解和生成。它解决了以前方法的局限性,同时仍然使用单一、统一的转换器架构进行处理。

值得注意的是,DeepSeek透露,对于1.5B和7B这两个参数的模型,整个训练过程在16节点和32节点的集群上进行,每个节点配备8块Nvidia A100(40GB)GPU。1.5B和7B模型的训练时间分别约为7天和14天。也就是说,DeepSeek仅用了两周时间,在256块英伟达A100 GPU上,就训练出了能够击败OpenAI DALL-E3和StableDiffusion的模型。

DeepSeek在报告中还展示了Janus-Pro-7B的具体效果。例如,使用“一条金色的寻回犬安详地躺在木质门廊上,周边铺满了秋天的叶子”和“一个有雀斑的年轻女人戴着一顶草帽,站在一片金色的麦田中”等提示,Janus-Pro-7B都能够准确捕捉语义信息,生成合乎逻辑且连贯的图片。尽管包含大量图像细节,但Janus-Pro-7B目前仅支持生成分辨率为384×384的图像。

此外,Janus-Pro-7B还具备图像识别功能。根据展示的案例,当给Janus-Pro-7B提供一张图片,并询问“猜猜这是哪里”时,它能够根据图片特点猜测出展示的是中国杭州的西湖,特别是著名的三潭映月岛,并进一步分析称,“图片中的建筑是三潭印月的亭子,周边是平静的湖水,远处是连绵的山脉。西湖是中国著名的旅游景点之一,以其美丽的自然景观和丰富的历史文化而闻名。”

事实上,DeepSeek一直在多模态领域进行积极探索。去年,公司就推出了一种基于自回归的多模态理解与生成统一模型Janus。进入2025年,DeepSeek将Janus进一步升级至Janus-Pro。此前在接受媒体采访时,梁文锋表示,DeepSeek在实现通用人工智能的过程中,主要押注了三个方向:数学和代码、多模态以及自然语言本身。

目前,DeepSeek的C端应用主要聚焦于文本能力,尚无法生成图片或识别图像。记者昨日曾尝试让DeepSeek生成一幅春节贺岁图片,但DeepSeek仅给出了图片创作的色调、原色等建议,并表示它目前还无法直接生成图片,“你可以根据此描述使用AI绘图工具如DALL·E、MidJourney等生成”。随着Janus-Pro的发布,用户或许很快就能使用DeepSeek进行图像、视频等领域的创作。

(文章来源:证券时报)