使用 MSpangenome 在共祖人口统计模型下模拟群体泛基因组

root 提交于 周五, 07/03/2026 - 22:47
研究动机:泛基因组变异图(pangenome variation graphs, PVGs)正日益被用于表征基因组多样性,然而目前尚不存在一种能够直接依据显式进化历史生成群体泛基因组的通用框架。现有模拟器通常仅关注某一类特定变异,且未能在由显式人口统计历史驱动、具有谱系感知能力的框架中整合这些变异。因此,在现实的人群遗传学情境下评估泛基因组方法仍然具有挑战性,而具有已知进化真实值的基准数据集也较为匮乏。 研究结果:我们提出了 MSpangenome,这是一种具有谱系感知能力的框架,用于衔接基于共祖理论的人群遗传学模拟与泛基因组图分析。该流程结合了利用 msprime 进行祖先模拟与一种从头图构建算法,可直接从模拟谱系中生成 PVG。通过显式建模重组、人口统计历史和不完全谱系排序,MSpangenome 能够生成结构复杂的泛基因组,其中嵌套和重叠的结构变异可从底层谱系中自然涌现,同时其进化历史和图拓扑在构建时即为已知。这为生成真实的群体泛基因组以及建立用于方法学评估的真实值数据集提供了一种通用框架。我们通过生成群体尺度的泛基因组,并将其作为可控参考,对广泛使用的图构建工具 PGGB 和 Minigraph-Cactus 进行了基准测试,从而展示了该框架的实用性。我们的分析揭示了在不同序列多样性水平、样本量以及结构变异类别下截然不同的性能表现,凸显了基于模拟的基准测试在识别那些仅依赖经验数据集难以检测的重建错误方面的价值。 可用性与实现:MSpangenome 使用 Python 实现,已实现完全容器化,可免费获取,网址为 https://forge.inrae.fr/pangepop/MSpangepop,并镜像托管于 https://github.com/inrae/MSpangepop

3 图卢兹大学,法国国家农业、食品与环境研究院(INRAE),MIAT,UR 875,奥克西塔尼-图卢兹中心,24 Chemin de Borde Rouge,31320 Auzeville-Tolosane,法国。 在 Google Scholar 上查找该作者 在 PubMed 上查找该作者 在持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。 本文依据 CC-BY 4.0 国际许可协议 发布。

返回顶部 上一页 下一页

发表于 2026 年 7 月 03 日。

下载 PDF 补充材料 数据/代码 电子邮件

感谢您有兴趣帮助传播 bioRxiv。 您的电子邮件 * 您的姓名 * 发送至 * 请输入多个地址,每行一个,或使用逗号分隔。

您将通过电子邮件发送以下内容 使用 MSpangenome 在共祖种群历史模型下模拟群体泛基因组

邮件主题 (您的姓名)已从 bioRxiv 向您转发一个页面

邮件正文 (您的姓名)认为您可能希望查看 bioRxiv 网站上的此页面。

您的个人留言

验证码 此问题用于测试您是否为人类访客,并防止自动垃圾信息提交。

分享 使用 MSpangenome 在共祖种群历史模型下模拟群体泛基因组

Lucien Piat ,Sukanya Denni ,Siegfried Dubois ,Benjamin Linard ,Ludovic Duvaux

bioRxiv 2026.06.29.735168; doi: https://doi.org/10.64898/2026.06.29.735168

分享本文: 复制 引文工具

使用 MSpangenome 在共祖种群历史模型下模拟群体泛基因组

Lucien Piat ,Sukanya Denni ,Siegfried Dubois ,Benjamin Linard ,Ludovic Duvaux

bioRxiv 2026.06.29.735168; doi: https://doi.org/10.64898/2026.06.29.735168


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.29.735168v1?rss=1

🏷️ 泛基因组 共祖模拟 群体遗传学 结构变异 变异图 基准测试