基于四元组一致性因子的系统发育网络“团块树”的统计推断

root 提交于 周一, 06/01/2026 - 06:47
系统发育网络表示涉及杂交、基因流动或混合的进化关系。尽管在常见的共祖模型下,完整网络可能无法仅由基因组数据识别,但其团块树(tree of blobs)——仅刻画网络结构中树状部分——是可识别的。我们提出了 ECToBlob(用于团块树的边收缩,Edge Contraction for Tree of Blobs),这是一种新的统计一致算法,可根据四元组一致性因子估计团块树。以一棵已解析树为起点,ECToBlob 依次收缩那些经统计检验表明不应属于团块树的边,这些边之所以应被收缩,是由于网状演化或多分叉信号的存在。我们证明,在常见假设下,ASTRAL 可提供一个有效的起始树,即当位点数趋于无穷时,优化 ASTRAL 准则的树会细化团块树。我们描述了该算法的若干变体,它们在如何整合来自多个检验的证据以判定某条边是否应被收缩方面有所不同,并提供了相应的软件实现。

系统发育网络表示涉及杂交、基因流动或混合的进化关系。尽管在常见的共祖模型下,完整网络可能无法仅根据基因组数据加以识别,但其 blob 树——即仅刻画网络结构中树状部分的表示——则是可识别的。我们提出 ECToBlob(用于 blob 树的边收缩,Edge Contraction for Tree of Blobs),这是一种新的具有统计一致性的算法,用于根据四元组一致性因子估计 blob 树。从一棵已解析的树出发,ECToBlob 依次收缩那些经统计检验表明不应属于 blob 树的边,这些边之所以不应保留,是由于网状进化或多分叉信号的存在。我们证明,在常见假设下,ASTRAL 可提供一个有效的初始树,即当位点数趋于无穷时,优化 ASTRAL 准则的树会细化 blob 树。我们描述了该算法的若干变体,它们在如何整合多个检验所提供的证据以判定某条边是否应被收缩方面有所不同,并提供了相应的软件实现。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.28.728501v1?rss=1

🏷️ 系统发育网络 团块树 四元组一致性因子 统计推断 算法开发