声网发布对话式AI引擎,引领AI交互新时代
AI导读:
声网发布对话式AI引擎,仅需两行代码、15分钟,即可让任意文本大模型“能说会道”。该产品拥有多项独家功能,全球范围内难寻对手,展现出强劲的市场潜力。
文/何己派
一家上海公司,帮助Deepseek像真人一样开口说话,引领AI技术新潮流。
3月上旬,声网发布对话式AI引擎,仅需两行代码,15分钟,即可让任意文本大模型“能说会道”,开启AI交互新时代。
这是个“新物种”,拥有多项独家功能,全球范围内难寻对手。对话成本极低,1分钟不到1毛钱。
“之前,大模型都是文字输入,将来,我们要让大模型更懂用户。”声网产品线负责人和利鹏表示。
为了这次的新产品,声网AI RTE产品线负责人姚光华透露,公司从春节开始疯狂赶工,2月18日推出Public Beta版本,此次发布已达到可商用状态。
截至3月7日美股收盘,声网市值为36亿元人民币,展现出强劲的市场潜力。
黑屋作战
DeepSeek爆火之际,声网产品团队悄然启动关键战役,组建专门团队,打造一款能与AI实时互动的工具产品。
项目历经半年酝酿,顺应DeepSeek浪潮陡然提速。团队成员像高考备战一样,室内放着倒计时白板,快速决策、快速推进。
大模型从单一模态走向多模态势不可挡,语音成为关键切入点。声网凭借在音视频领域的深厚积累,期望将RTE技术与生成式AI结合,抢占制高点。
除夕当天,对话式AI引擎上线Private Beta版本,首批开发者和客户让DeepSeek开口拜年,实现AI交互新突破。
对声网而言,这款产品的意义非凡。从人与人的交流转向人与机器的交流,实时互动要求更高,技术挑战更大。
姚光华提到,AI语音秒回、模拟真人对话节奏、随时打断AI等功能均源于客户需求,实际落地需要边走边试。
“比如对话人声锁定功能,就是客户提出的。”姚光华说,客户是最好的导师。
拆解引擎
“之所以叫‘对话式AI引擎’,在于我们只做对话式工具,不做Agent。”姚光华强调。
团队最终选择“引擎”作为产品名字,亮明声网的态度:提供能力,与大模型厂商合作而非竞争。
和利鹏透露,声网与国内多家模型厂商合作,实时互动是AI Infrastructure的一部分,声网的角色是交互。
对话式AI引擎具备AI语音秒回、对话人声锁定、智能打断、全模型适配等多项能力,实现“多快好省”。
响应延迟以毫秒为单位压缩,中位数达650ms;对话体验方面,精准识别对话人声,保持稳定流畅对话;开发部署上,程序员只需两行代码、15分钟即可实现快速部署。
价格方面,AI语音对话0.098元/分钟,“智能打断”功能作为增值服务定价0.042元/分钟,一次性增予所有开发者1000分钟免费额度。
姚光华表示,用户与AI每次对话平均约有3轮问答,单次成本为3分钱,年成本仅需5元。
人机未来
对话式AI引擎的应用场景广泛,包括智能助手、虚拟陪伴、口语陪练等。声网已落地十几种场景,陪伴类和智能硬件需求较多。
例如,让DeepSeek陪伴孩子应对天马行空的问题,同时保持自然交流。实时互动从人与人走向人与机器,对声网而言是很大的延展。
和利鹏表示,或许下一个变革是所有触摸式和键盘式交互都变成语音式。技术革新转瞬即逝,产品发布需紧跟技术步伐。
“现在这个版本虽非万能,但用户体验已达标。未来我们将继续拓展功能。”姚光华说。
DeepSeek引爆赛道,声网专攻音频细分方向,前景广阔。
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

