AI导读:

字节跳动豆包模型发布视觉理解模型,价格大幅降低,并预告新一代视频生成大模型。同时,字节在AI硬件端开始布局,算力需求或进一步扩大,有望拉动AI服务器及热管理市场需求。

字节跳动旗下的豆包模型正持续展现其强劲的发展势头,今日再度迎来重大更新。

截至目前,豆包大模型的日均tokens使用量已突破4万亿大关,自发布以来的7个月内,其使用量增长了超过33倍,展现出惊人的增长速度。

在今日的火山引擎Force原动力大会上,豆包又发布了全新的视觉理解模型。这一模型具备卓越的内容识别、理解、推理及视觉描述能力,为用户带来更加丰富的交互体验。火山引擎总裁谭待宣布,豆包视觉理解模型的价格已降至0.003元/千Tokens,这一价格相比行业平均水平降低了85%,无疑将为用户带来更多实惠。

此外,字节跳动还透露,新一代的视频生成大模型豆包将于明年1月正式面世。同时,抖音旗下的图片和视频生成工具即梦AI也展示了其新一代的图片生成模型和动态海报功能,为用户提供了更多样化的创作选择。

从字节跳动的最新动态来看,公司依然坚持在生成式AI领域的“饱和式”投入策略。此前,豆包大模型家族已涵盖了通用大语言、语音合成与识别、图片及视频等不同模态的生成式AI模型。然而,在视觉交互方面仍存在短板。此次发布的视觉理解模型,正好弥补了这一不足,使得“豆包全家桶”在视觉交互上更加完善。

西部证券在12月15日的报告中指出,视觉能力是大模型能力的核心。在人类交互信息中,视觉输入占据了绝大多数。因此,在下一代AI硬件终端中,如AI玩具或AI眼镜等,视觉SoC有望成为标配。这将进一步推动对NAND存储芯片的需求增长。分析师建议关注视觉SoC领域的恒玄科技、星宸科技、安凯微,以及存储领域的东芯股份、普冉股份。

国盛证券也表示,字节跳动凭借其在开放式耳机音频技术、大模型技术以及丰富的软件应用生态方面的优势,有望在AI眼镜产品领域成为核心玩家。

随着豆包从文字大模型向视觉理解模型和视频生成模型的拓展,“豆包+”生态已初步显现。若再加上猫箱、即梦等字节旗下的更多AI应用,字节跳动的算力需求或将再次大幅提升。国盛证券的研报指出,算力已成为字节跳动AI产业链的核心方向。

据分析师测算,仅以豆包类似的文字模型为例,若ChatGPT的月活用户为6亿,则其推理需求约需35万个A100显卡,训练需求则需12万个A100显卡。而对于视频大模型而言,其对算力的需求无疑更高。以即梦AI的视频生成模型Magic Video v2为例,若其月活用户达到1亿,且每天有生成10分钟视频的需求,则需28万个英伟达H100 GPU。若月活用户达到2亿,则对H100的需求将达到55万个。

服务器代工厂英业达已获得了字节跳动、百度、阿里巴巴、腾讯等公司的订单,主要出货形式为L10(机柜组装与测试)及L11(服务器整合与机架布建)。英业达日前表态也暗示了字节等公司对算力的强劲需求。本季度客户对AI服务器的需求较预期强劲,今年AI服务器营收有望同比增长2.5-3倍,明年出货量将进一步增长。

民生证券指出,豆包用户数的快速增长将推动算力中心的扩建,进而带动AI服务器需求的提升。同时,算力中心扩建不仅带来基础建设需求,更将引发对热管理的需求。字节跳动的AI端液冷技术有望在这一领域拉动广阔的市场空间。

据《科创板日报》不完全统计,A股中与字节跳动算力硬件相关的公司有图中所列多家。(附相关公司图片)

(文章来源:财联社)