为什么与我们的“沙鼠大脑”联系可以帮助机器更好地倾听

科技
0 302

澳大利亚麦观理大学的研究人员推翻了一个持续了75年之久的关于人类如何确定声音来源的理论,这项发现可能揭示了创造下一代更适应和高效听觉设备的秘密,从助听器到智能手机。

1940年代,为解释人类如何根据声音到达每只耳朵的时间差异来确定声源位置,提出了一个工程模型。该模型认为我们必须拥有一组专门的探测器,其唯一功能是确定声音的来源地点,空间中的位置由专门的神经元表示。

这一假设自那时以来一直指导和影响着研究以及音频技术的设计。

但麦观理大学听觉研究人员在《Current Biology》杂志上发表的一篇新研究论文最终揭示了这一关于空间听觉的神经网络不成立的理论。

首席作者、麦观理大学杰出听觉教授大卫·麦卡尔派恩(David McAlpine)在过去25年中一直致力于证明一个接一个的动物实际上使用的是一个更稀疏的神经网络,脑的两侧的神经元除了其他功能外还执行这个功能。

通过结合专门的听觉测试、先进的脑成像技术以及与恒河猴等其他哺乳动物的大脑进行比较,他和他的团队首次展示了人类也使用这些更简单的网络。

研究团队还证实了相同的神经网络可以将语音与背景声音分离,这一发现对助听设备和手机电子助手的设计具有重要意义。

麦卡尔派恩教授表示,他团队的最新发现表明,我们不应该再把重点放在目前所使用的大语言模型(LLMs)上,而应该采取更简单的方法。

“LLMs在预测句子中的下一个单词方面表现出色,但它们试图做得太多了”,他说。

“能够定位声音源头才是重要的,为了做到这一点,我们并不需要一个‘深度思考’的语言大脑。其他动物可以做到,它们没有语言。

“当我们在倾听时,我们的大脑并不会一直追踪声音,而正是这种大型语言处理器一直在尝试做的事情。

“相反,我们和其他动物使用我们的‘浅层大脑’来捕捉非常小的声音片段,包括语音,并使用这些片段来标记声源的位置,甚至可能是其身份。

“我们不必重建一个高保真信号来做到这一点,而是要理解我们的大脑是如何在神经上代表这个信号的,远早于它到达皮层的语言中心。

“这告诉我们,一台机器并不必顾及像人脑那样接受语言训练才能有效地倾听。

“我们只需要那只沙鼠的大脑。”

该团队的下一步是确定可以在一个声音中传达的最少信息量,同时获得最大的空间倾听能力。

0 收藏 分享 举报
  • «
  • »