- 3 次围观
系统发育树的精确推断是进化生物学的基础,然而现有方法依赖于复杂的流程,包括多序列比对、显式进化模型以及计算开销巨大的树搜索过程。本文提出 BetaInfer,一种生成式框架,将系统发育树推断重新表述为序列转换问题。BetaInfer 利用基于混合 Transformer 的架构,直接将未比对序列集合映射为以 Newick 格式表示的系统发育树。在具有已知真实值的大规模模拟进化数据上训练后,BetaInfer 学会了直接从序列数据中捕捉复杂的进化信号。基于集成的多个候选树生成进一步提高了鲁棒性,使重建误差相较于单次预测降低了 30% 以上。 在对模拟数据集和经验数据集进行的大量评估中,BetaInfer 相较于最先进的系统发育分析流程展现出具有竞争力的性能;在广泛条件下,其准确性可与成熟的基于似然的方法和基于距离的方法相媲美,且在某些情况下甚至超过这些方法。可解释性分析表明,BetaInfer 利用内部的成对距离计算,将进化关系综合为一种统一的全局表征,从而支持直接生成系统发育树。综上,这些结果表明,生成式模型能够作为标准系统发育分析流程一种可行且可扩展的替代方案。
本网站正在使用一项安全服务以保护其免受在线攻击。您刚刚执行的操作触发了该安全解决方案。可能触发此拦截的行为有多种,包括提交某个特定单词或短语、SQL 命令或格式错误的数据。
您可以向网站所有者发送电子邮件,告知其您已被拦截。请在邮件中说明当该页面出现时您正在进行的操作,并附上位于本页底部的 Cloudflare Ray ID。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.14.732140v1?rss=1
🏷️ 系统发育树 生成模型 Transformer 序列转换 进化推断
来源出处