- 2 次围观
摘要 背景。结核分枝杆菌宿主体内遗传异质性具有生物学和临床信息价值,但基于短读长全基因组测序对其进行检测,依赖于对测序深度(DP)、替代等位基因支持数(AD)和次要等位基因频率(MAF)所设定的阈值,而这些阈值很少具有经验性的锚定依据。 方法。我们开发了一种以生物学重复为锚定、采用词典序校准的单样本宿主体内单核苷酸变异(iSNV)检测框架。在一个治疗前结核病(TB)队列中,对患者体内重复痰样本对在联合(DP、AD、MAF)网格上的六项一致性指标进行了评分;该选择器对无信号区域进行惩罚,并依据可重复性对各网格单元进行排序,在出现并列时以敏感性作为决胜标准。通过对重复样本对进行B=1,000次非参数自助法重采样,量化选择稳定性,并据此定义了宽松/主要/更严格的敏感性层级。将校准后的规则应用于97例患者提供的282份培养痰标本。 结果。基于来自67例患者的169对重复样本进行校准后,确定主要单元为DP[≥]60x、AD[≥]3、MAF[∈][0.02, 0.50]。在703次成功重复中,自助法模态单元有45.7%与主要单元一致(MAF = 0.02占100%;AD = 3占90.2%)。在主要层级下,每位患者可检测到宿主体内多样性的患病率为16.5%(16/97,Wilson 95%置信区间:10.4%–25.1%);宽松和更严格层级得到的比率相近。 结论。患者体内重复样本一致性为TB全基因组测序中iSNV检测阈值提供了可重复的经验性锚定依据。该框架经过内部校准,并以明确的敏感性层级进行报告。校准后的规则可应用于外部队列,作为对其可迁移性的直接检验。
摘要 背景。结核分枝杆菌宿主体内遗传异质性具有生物学和临床信息价值,但基于短读长全基因组测序对其进行检测,依赖于测序深度(DP)、替代等位基因支持数(AD)和次要等位基因频率(MAF)的阈值,而这些阈值很少有经验性依据。
方法。我们开发了一种以生物学重复为锚定、按字典序校准的针对单个样本的宿主体内单核苷酸变异(iSNV)检测框架。在一个治疗前结核病(TB)队列中,对患者体内配对的重复痰样本在联合(DP、AD、MAF)网格上依据六项一致性指标进行评分;该选择器对无信号区域进行惩罚,并按照可重复性对各网格单元进行排序,在出现并列时以敏感性作为决胜标准。通过对重复样本对进行B=1,000次非参数自助法重采样来量化选择稳定性,并据此定义了较宽松/主要/较严格的敏感性阶梯。随后将校准后的规则应用于97例患者提供的282份培养痰样本。
结果。基于来自67例患者的169对重复样本进行校准后,确定主要单元为DP[≥]60x、AD[≥]3、MAF[isin][0.02, 0.50]。在703次成功重复中,自助法众数单元有45.7%与主要单元一致(其中MAF = 0.02的比例为100%;AD = 3的比例为90.2%)。在主要层级下,患者层面可检测到宿主体内多样性的患病率为16.5%(16/97,Wilson 95%置信区间:10.4%–25.1%);较宽松和较严格层级得到的比率相近。
结论。患者体内重复样本的一致性为结核病全基因组测序中iSNV检测阈值提供了可重复的经验性锚点。该框架经过内部校准,并以明确的敏感性层级进行报告。校准后的规则可应用于外部队列,以直接检验其可迁移性。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.27.727477v1?rss=1
🏷️ 结核分枝杆菌 全基因组测序 宿主体内变异 iSNV检测 重复样本校准 阈值优化