人类及其近缘灵长类亲属发声中声学空间使用的测量与比较

root 提交于 周二, 06/16/2026 - 20:47
与近缘灵长类相比,人类喉部位置更深,且缺乏声膜和气囊。通常,对这些变化的分析主要聚焦于其对类元音发声的声学效应,因为长期以来,人们认为言语的进化需要由声道改造所驱动的发声范围扩展。然而,元音只是音位的一种类型,而言语也只是人类发声的一类。要理解人类发声形态已知变化的进化基础,就需要进行更广泛的生物声学比较。具体而言,必须将人类言语中使用的声音范围,与其他人类发声以及现生近缘灵长类亲属发声库中所使用的声音范围进行比较。 在此,我们测量了人类言语、非语言性发声和音乐性发声,以及黑猩猩、倭黑猩猩和查克马狒狒叫声所占据的声学特征空间。我们采用梅尔频率倒谱系数构建声学空间,以表征来自已发表数据库及其他经验证来源的超过75万个短时发声片段的频谱—时间特征。言语和歌唱在该声学空间中所占据的体积显著小于人类非语言性发声。此外,言语和歌唱的声学特征体积在统计上与非人灵长类并无显著差异。这些结果表明,言语并非由人类发声声学空间的扩展所促成。人类特有的解剖学变化可能导致了非语言性话语的复杂化,但习得性发声仅使用了这一空间中令人惊讶地小的一部分。通过进一步系统比较非言语发声的功能与同源性,并收集和纳入更完整的非人灵长类发声数据集,尤其是来自大猩猩和红毛猩猩的数据,我们对人类发声进化的理解将得到进一步深化。

与密切相关的灵长类相比,人类喉部位于更深的咽喉处,且缺乏声膜和气囊。这些变化通常从其对类元音发声的声学影响来分析,因为长期以来人们认为,言语的进化需要由声道改造所驱动的发声范围扩展。然而,元音只是音位的一种类型,而言语也只是人类发声的一类。要理解人类声学形态已知变化的进化基础,需要更广泛的生物声学比较。具体而言,必须将人类言语所使用的声音范围,与其他人类发声以及现存近缘灵长类的声 repertoire 所采用的范围进行比较。在此,我们测量了人类言语、非语言性发声和音乐性发声,以及黑猩猩、倭黑猩猩和查克马狒狒叫声所占据的声学特征空间。我们使用梅尔频率倒谱系数构建了一个声学空间,用以描绘来自已发表数据库及其他经验证来源的75万余段短暂发声片段的时频特征。言语和歌唱在该声学空间中占据的体积显著小于人类非语言性发声。此外,言语和歌唱的声学特征体积与非人灵长类并无统计学差异。这些结果表明,言语并非因人类发声声学空间的扩展而得以实现。人类特有的解剖学变化可能促成了非语言性发声的进一步发展,但习得性发声仅使用了这一空间中出人意料地很小的一部分。通过进一步系统比较非言语发声的功能与同源性,并收集和纳入更完整的非人灵长类发声数据集,尤其是来自大猩猩和猩猩的数据,我们对人类发声进化的理解将得到进一步深化。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.14.732185v1?rss=1

🏷️ 灵长类发声 生物声学 声学特征空间 言语进化 梅尔频率倒谱系数