AI导读:

一个经过数十小时真实对话训练的人工智能(AI)模型,成功预测了人类大脑活动,揭示了语言结构特征无需编码即可显现。科学家借此探索日常对话中的复杂大脑活动,有望改进语音识别技术,助力人类交流。

据美国趣味科学网站3月16日报道,一个经过数十小时真实对话训练的人工智能(AI)模型,成功预测了人类大脑活动,揭示语言结构特征无需编码即可显现。科学家们借此AI工具,深入探索日常对话中的复杂大脑活动。

研究人员指出,这一AI工具有望为语言神经科学带来新见解,未来或能改进语音识别技术,助力人类交流。

基于AI模型将音频转录为文本的方式,研究人员能更精确地绘制对话中的大脑活动图,相较于传统模型对音素、词性等语言结构特征的编码,此方法更为高效。

研究中使用的名为Whisper的模型,通过音频文件及其文本记录训练,学习预测新音频文件的文本。Whisper无需预设语言结构特征,但研究显示,模型训练后,这些结构仍会显现。这揭示了大型语言模型的工作原理。

研究小组更关注AI对人类语言和认知的洞察,探索模型与人类语言处理能力的相似之处,或有助于设计促进交流的设备。

研究报告主要作者、以色列耶路撒冷希伯来大学助理教授阿里埃勒·戈德斯坦表示,研究结果挑战了我们对认知的传统看法,提示我们应通过统计模型的视角思考认知。

研究小组用80%的录制音频和文本记录训练Whisper,预测剩余20%的音频文本。随后,他们对比了Whisper捕捉的音频、文本记录与电极捕捉的大脑活动。

分析显示,该模型能准确预测未出现在训练数据中的对话伴随的大脑活动,性能优于基于语言结构特征的模型。尽管未编程音素或单词内容,但模型在推测文本过程中仍体现了这些语言结构。

德国慕尼黑神经科学中心研究小组负责人莱昂哈德·席尔巴赫称,此研究开创性地展示了计算声学-语音-语言模型与大脑功能之间的联系,但还需更多研究验证这种关系是否意味着语言模型与大脑处理语言机制存在相似性。

(文章来源:参考消息)