一种用于从多克隆感染中推断传播网络的模块化贝叶斯框架:以恶性疟原虫为例

root 提交于 周六, 05/30/2026 - 00:12

研究动机:分子监测和传染病传播网络重建能够为估计那些难以直接观测的公共卫生量提供有力证据,包括输入性传播、源—汇结构,以及不同地点或干预分层之间后续传播的差异。这些量可以表示为底层传播网络的函数,但个体传播事件很少被直接观测到,并且往往有许多网络都可能与同一组数据相一致。现有利用遗传数据进行传播网络重建的方法,通常建立在以下情境之上:每次感染具有一个主要来源、一个代表性单倍型,以及沿传播链由突变驱动的遗传分化。这些假设与多克隆感染并不匹配;在多克隆感染中,宿主体内携带多个遗传上不同的克隆,而受体感染可能反映来自多个来源的共同贡献。这类感染在疟疾、结核病、HIV以及许多寄生虫感染中都很常见。因此,亟需能够适应此类数据的方法。

研究结果:我们提出了一个模块化贝叶斯框架,用于估计已采样病例之间的有向传播关系,其中一次感染可以没有已采样父节点、只有一个父节点,或具有多个父节点,同时也允许来源于观测样本集合之外的传染源。病原体特异性模块为候选父节点集合提供似然,并与共享推断过程相连接,从而得到边的边际有向概率、后验平均出度,以及未观测父节点的纳入概率。我们通过 Plasmotrack 展示了该框架的应用;Plasmotrack 是一个针对恶性疟原虫(\textit{Plasmodium falciparum})的传播网络模型,使用靶向扩增子测序数据。我们实现了这些组件,包括逐位点等位基因混合传播似然、扩增子基因分型误差模型,以及允许未观测父节点的数据增广方法。基于一个具有生物学依据的生成模型进行的模拟表明,在推断所用的逐位点等位基因混合似然存在模型设定偏差的情况下,该方法仍能恢复网络的聚合性摘要指标,包括平均出度和未观测来源纳入的平均水平,并且在检测有向传播方面具有较高的精确率和召回率。对于其他病原体,只需替换传播似然和观测似然,即可复用同样的模块化组合。

可用性:Plasmotrack 软件及其文档可在 https://github.com/eppicenter/plasmotrack 获取。源代码和示例数据集以开源许可证提供。

感谢您有意帮助传播 bioRxiv 的相关信息。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.14.725082v1?rss=1

🏷️ 传播网络重建 模块化贝叶斯框架 多克隆感染 恶性疟原虫 分子监测