AI导读:

火山引擎总裁谭待在Force大会上宣布,豆包通用模型日均tokens使用量超4万亿,并发布视觉理解模型、3D生成模型等。同时,火山引擎与多家企业合作探索AI应用场景,如AI语音玩具、AI+硬件智跃计划等。

在火山引擎Force大会上,火山引擎总裁谭待宣布,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,相比七个月前首次发布时增长了惊人的33倍。此前,豆包App在全球月活跃用户排行榜上表现优异,MAU已逼近6000万,仅次于OpenAI的ChatGPT,稳居全球第二。

会上,字节跳动正式揭晓了豆包视觉理解模型、豆包3D生成模型,以及全面升级后的豆包通用模型pro、音乐模型和文生图模型等。特别值得一提的是,豆包视觉理解模型的千tokens输入价格仅为3厘,即一元钱可处理高达284张720P的图片,展现了其高效的成本效益。大会还透露,字节跳动计划在2025年春季推出功能更为强大的豆包视频生成模型1.5版,支持更长视频的生成,同时豆包端到端实时语音模型也将很快面世。

《科创板日报》记者独家获悉,火山引擎边缘云携手润欣科技共同打造了AI语音玩具,该玩具的Wi-Fi模组由恒玄科技提供,涂鸦智能亦参与其中,提供相关模组和对接平台。现场体验显示,消费者可以与AI玩具“小狗”进行流畅的语音互动,享受其提供的回答问题和陪伴服务。

产业链人士对AI语音玩具的未来销量持乐观态度,预计今年年底至明年年初将有首批AI玩具上市,并预测明年上半年将有大量新玩家涌入市场。然而,AI玩具的落地也面临挑战,如需要针对不同年龄段构建优质知识库以实现更好的人机互动,以及高频的日常互动带来的云端推理费用问题。

在会上,火山引擎视频云联合乐鑫科技、ToyCity共同启动了AI+硬件智跃计划,旨在结合豆包大模型、火山引擎的拟人语音对话技术、ToyCity潮玩设计以及乐鑫科技的AI芯片等产品力优势,推动AI潮玩的普及。乐鑫科技将为AI潮玩提供一站式硬件解决方案,包括端侧音视频处理等。

在机器人领域,地平线旗下地瓜机器人与火山引擎边缘云正基于大模型网关进行智能机器人的开发,共同打造了基于边缘大模型网关的机器人智能感知与控制系统方案。该方案利用边缘优势,实现大模型服务的就近调用,提升响应速度和稳定性。

此外,乐聚机器人也与豆包大模型建立了合作关系,目前主要应用于科研、展厅导览等领域,并积极探索工业领域的应用。

在端侧AI方面,豆包大模型已接入多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年内实现了100倍的增长。

火山引擎还与英特尔携手探索PC端大模型的应用。荣耀手机的魔法修图、AI摘要功能均由豆包大模型提供支持,而vivo手机则采用了豆包音乐模型,为相册用户的一键成片功能提供音乐创作能力。

谭待向《科创板日报》介绍,国内大部分安卓手机品牌都在与豆包展开合作。他表示,手机厂商会根据不同场景选择使用豆包或其他大模型,或混合使用多个模型。对企业用户而言,采用多云或多模型策略是正常现象,最终选择将基于能力和成本的综合考量。

基于字节跳动的AI智能体开发平台扣子,已有大量应用场景正在探索中。例如,与苏泊尔合作探索AI个性化食谱生成,提升炒菜机的服务水平;与机智云合作开展AI养鱼项目,根据鱼缸设备的实时数据自动为用户提供优化方案;与猫王音响合作推出AI智能音响等。

扣子的智能体开发社区已汇聚超过100万活跃开发者,共同创造了超过200万个智能体应用。在车企方面,东风汽车、智己汽车、奔驰旗下SMART汽车等品牌均与豆包大模型开展了智能座舱等方面的合作。谭待透露,国内八成以上的主流汽车品牌都在与豆包大模型展开合作。

字节跳动计划在2025年春季推出功能增强的豆包视频生成模型1.5版。针对可能存在的算力挑战,谭待表示,火山方舟提供的豆包大模型MaaS推理服务储备充足,能够为用户提供业界最大的TPM和RPM。他强调,系统的流畅性不仅取决于算力,还涉及前端、接入端以及工程化优化等多个方面。

对于未来大模型领域的市场竞争,谭待认为目前仍处于市场早期阶段,更应关注用户需求而非竞争。他表示,当前市场可能仅开发了千分之一的潜力,因此无需过分关注竞争问题。

(文章来源:科创板日报)