- 3 次围观
比较生物学与宏演化生物学同时依赖于对两个问题的认识:物种层级生命之树在何处已得到经验性解析,以及在何处尚未得到解析。然而,用于支撑后续推断的系统发育树通常被视为固定输入,尽管其经验基础在深层次上具有高度异质性,而这种异质性一旦下载为树文件便会消失不见。不同系统发育树在推断框架、定年方案、由直接分子数据支持的物种与由分类学约束插入的物种之间的平衡,以及在推断过程中按节点估计的不确定性是否能够从原始分析保留到存档衍生版本等方面均存在差异。这些选择会在无声无息中累积并进入跨谱系分析,而目前尚无任何资源能够在细菌域、古菌域和真核生物域范围内一致地描绘系统发育知识的当前状态。我们提出一个起点:首次系统性清查哪些部分已被经验性解析,哪些部分尚未被解析。我们构建了一个包含264个物种层级系统发育树的图谱,将其映射到一个统一的全球物种词典之上,该词典约含637,000个名称标签,并组织为62个已描述生物多样性分区;同时,另有36个分区被明确保留为未表征状态,从而使系统发育“暗物质”能够以与已表征谱系相同的分辨率保持可见。对于每一棵规范树,我们建立了逐树溯源台账,记录其推断框架、定年方案、以分子数据而非分类学为锚定的末端比例,以及对推断不确定性在数据存档过程中保留程度的审计;同时,我们还明确设定了一个从宽松到最严格的纳入标准敏感性包络,使每一项覆盖度陈述都被限定在其自身可审计规则的范围之内。由于关于生命之树的知识本身也在不断变化,该图谱通过配套R程序包phyloatlas以及按分区设置的wiki,以版本化且持续更新的资源形式发布,从而使后续比较分析能够将溯源信息与纳入标准不确定性传播到其自身推断之中,而不必在无声中固化于某一组特定选择。
比较生物学与宏演化生物学同时依赖于对两个问题的认知:物种层级生命之树在何处已得到经验性解析,以及在何处尚未得到解析。然而,用于支撑后续推断的系统发育树却常被视为固定输入,尽管其经验基础在多个方面都具有深刻的异质性,而这些异质性一旦树被下载下来便会消失不见。不同系统发育树在推断框架、定年方案、由直接分子数据支持的物种与通过分类学约束插入的物种之间的平衡,以及在推断过程中估计的节点不确定性在从原始分析到存档衍生版本的过程中是否得以保留等方面均存在差异。这些选择会悄然累积并进入跨类群分析,而目前尚无任何资源能够在细菌域、古菌域和真核生物域之间统一描绘系统发育知识的现状。我们提出一个起点:首次系统清查哪些部分已经、哪些部分尚未得到经验性解析。我们构建了一个包含264个物种层级系统发育树的图谱,将其映射到一个由约637,000个标签组成的单一全球物种词典上,并组织为62个已描述生物多样性分区;同时,另有36个分区被明确保留为未被代表,从而使系统发育“暗物质”能够以与已代表类群相同的分辨率保持可见。对于每一棵规范树,我们建立了逐树来源记录,记载其推断框架、定年方案、以分子数据而非分类学为基础锚定的末端比例,以及对推断不确定性在存档过程中保留程度的审计;同时,通过从宽松到最严格的纳入标准所构成的显式敏感性包络,为每一项覆盖度陈述提供了可审计规则下的界定范围。由于关于生命之树的知识本身也在不断变化,该图谱通过配套的R程序包phyloatlas和逐分区wiki以带版本、持续更新的资源形式发布,从而使下游比较分析能够将来源信息与纳入标准不确定性传播到其自身的推断之中,而不是在无声无息中默认于某一套选择。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.31.729127v1?rss=1
🏷️ 生命之树 系统发育学 宏演化 物种层级 系统发育不确定性 生物多样性图谱