EEG-语音包络跟踪的频率依赖性并不反映语音单元或音高的速率

root 提交于 周二, 06/16/2026 - 22:47
在语音聆听过程中,神经活动会部分地与刺激声学振幅包络的波动同步。对语音包络的这种神经跟踪,常被认为与音节节律性和音高周期性等声学特征的加工有关。然而,神经包络跟踪的频率依赖性在多大程度上反映了声学和语言学语音单元的速率,迄今尚未得到研究。 在本研究中,我们利用一个大型脑电图(EEG)反应数据集,受试者聆听自然语音,并采用相干性分析在广泛的调制频率范围内量化了对语音包络的神经跟踪。相干性谱在低δ频段(0.2–2 Hz)、θ-α频段(4–15 Hz)以及接近45、95和175 Hz的较高频率处表现出明显峰值。我们表明,这一结构独立于音素、音节和词语的速率,也独立于音高周期性。 进一步地,利用时间响应函数(TRFs),我们表明γ频段(30–250 Hz)中的神经包络跟踪主要由两簇神经发生源驱动,其潜伏期分别约为8 ms和25 ms,可能分别位于吻侧脑干以及丘脑皮层通路范围内。 总之,这些结果凸显了不同神经机制与神经来源在塑造神经包络跟踪中的相互作用,并为在窄频带内评估神经包络跟踪的研究带来了重要的方法学和解释性考量。

在语音聆听过程中,神经活动会部分地与刺激声学振幅包络的波动同步。对语音包络的这种神经追踪经常被认为与声学特征的加工有关,例如音节节律性和音高周期性。然而,神经包络追踪的频率依赖性在多大程度上反映了声学和语言学语音单元的速率,迄今尚未得到研究。

在本研究中,我们利用一个大型数据集,其中包含受试者聆听自然语音时的脑电图(EEG)反应,采用相干分析在广泛的调制频率范围内量化了对语音包络的神经追踪。相干谱在低δ频段(0.2–2 Hz)、θ-α频段(4–15 Hz)以及接近45、95和175 Hz的更高频率处呈现出明显峰值。我们表明,这种结构独立于音素、音节和词语的速率以及音高周期性。

进一步地,利用时间响应函数(TRF),我们表明γ频段(30–250 Hz)中的神经包络追踪主要由两簇神经发生源驱动,其潜伏期分别约为8 ms和25 ms,推测分别位于吻侧脑干以及丘脑—皮层通路。综上,这些结果突出了不同神经机制与来源在塑造神经包络追踪中的相互作用,并为那些在狭窄频带内评估神经包络追踪的研究带来了重要的方法学和解释层面的考量。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.14.732143v1?rss=1

🏷️ 脑电图 语音包络跟踪 频率依赖性 相干性分析 时间响应函数 听觉神经加工