AI导读:

豆包即将发布最新实时语音大模型,并全量上线实时语音通话功能。该模型日均调用量在7个月内增长超过33倍,中信证券称这体现了字节跳动在AI的投入形成正反馈。

豆包公司即将推出一款最新的实时语音大模型,并计划基于这一模型全面上线豆包App的实时语音通话功能。目前,豆包APP已经针对这一最新功能进行了小范围的测试,部分用户的实时通话界面已经完成了更新。此前,业内曾有传闻称豆包将推出一款最新的情感语音大模型,并声称其测试效果超越了GPT-4。经证实,该传闻中所提及的模型正是即将上线的实时语音模型。这款最新模型通过针对语音生成和理解进行统一建模,摒弃了传统的ASR+LLM+TTS级联方式,从而在对话效果上实现了显著提升。在实时交互方面,该模型不仅具备低延时的特点,还能够流畅地支持对话打断。

根据火山引擎在2024年冬季force原动力大会上披露的数据,豆包大模型的日均调用量呈现出高速增长的态势。具体而言,2024年5月,豆包大模型的日均tokens调用量仅为1200亿,而到了7月,这一数字已经增长到5000亿,9月更是达到了1.3万亿。截至2024年12月15日,豆包大模型的日均tokens调用量已经突破了4万亿大关,在短短7个月的时间内实现了超过33倍的增长。中信证券对此表示,豆包大模型的表现超出了预期,这充分体现了字节跳动在AI领域的投入正在形成正反馈。同时,这也标志着国内AI产业在追赶海外同行方面取得了显著成效,国内龙头公司有望加速在AI领域的布局和投入。

据财联社主题库显示,与豆包大模型相关的上市公司中,海天瑞声在互动平台上回复称,字节跳动一直以来都是公司的重要客户,公司为其提供了包括智能语音、计算机视觉以及自然语言处理在内的各类数据产品或服务。此外,乐鑫科技在投资者关系活动上透露,公司正在联合推广豆包大模型在IoT设备上的相关应用方案,以进一步拓展豆包大模型的应用场景和市场潜力。

(文章来源:财联社)