定义伪单倍型分析揭示了BAF染色质重塑复合体中跨多基因的遗传模式

root 提交于 周日, 06/28/2026 - 02:47
BRG1相关因子(BAF)是一种关键的染色质重塑复合体。编码BAF复合体组分的基因中的变异会导致人类疾病,包括癌症和发育障碍。然而,BAF基因内部的遗传多样性及其变异共现模式仍未得到充分理解。尽管尚缺乏系统检验,但常见变异的罕见组合模式有可能像罕见有害变异一样改变功能。此外,目前尚无关于个体同时携带多个罕见和常见变异频率的现代化系统统计,也缺乏供基因组学从业者评估这些变异综合效应的方法。因此,需要采用能够表征个体样本完整序列的方法。 在本研究中,我们引入了一种伪单倍型分析(PHA)框架,将在单个样本中同时观察到的多个蛋白编码序列变异整合为离散的BAF模式。在该队列中,78.44%的伪单倍型(PH)拷贝至少携带一个BAF编码变异。其中,56.18%包含至少两个不同变异,32.39%包含三个或更多变异,表明个体中多变异构型具有显著负担。值得注意的是,25.30%的独特PH仅被观察到一次,这表明相当一部分人群受到罕见或个体特有遗传变异组合的影响。我们在全球人群中鉴定出多个显著(FDR

BRG1相关因子(BAF)是一种关键的染色质重塑复合物。编码BAF复合物组分的基因中的变异会导致人类疾病,包括癌症和发育障碍。然而,BAF基因内部的遗传多样性及其变异共现模式仍未得到充分理解。尽管尚未得到充分检验,但常见变异的罕见组合模式有可能以类似于罕见有害变异的方式改变功能。此外,目前尚无关于个体同时携带多个罕见和常见变异频率的现代统计,也缺乏供基因组学从业者评估其联合作用的方法。因而,亟需能够从单一样本中表征完整序列的方法。

在本研究中,我们提出了一种伪单倍型分析(PHA)框架,将在单个样本中同时观察到的多个蛋白编码序列变异整合为离散的BAF模式。在该队列中,78.44%的伪单倍型(PH)拷贝携带至少一个BAF编码变异。其中,56.18%包含至少两个不同的变异,32.39%包含三个或更多变异,表明个体中多变异构型负担相当显著。值得注意的是,25.30%的唯一PH仅被观察到一次,这凸显出相当一部分人群受到罕见或个体特有的遗传变异组合影响。我们在全球人群中鉴定出多个显著的(FDR

这些发现强调,在研究疾病关联和遗传机制时,必须考虑人群特异性的遗传结构以及个体完整的变异构型。我们的方法为在人群尺度上表征染色质重塑基因中的多变异架构提供了一个可推广的框架,并有望应用于阐明疾病病因学和推动精准医学发展。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.22.732952v1?rss=1

🏷️ 染色质重塑复合体 BAF复合体 伪单倍型分析 遗传变异共现 人群遗传结构 精准医学