利用基因调控深度学习模型指导药物优先排序

root 提交于 周四, 06/11/2026 - 04:47

药物再利用为加速治疗发现提供了一种具有成本效益的策略,但大多数计算方法未能对非编码遗传变异进行建模。由于超过90%的全基因组关联研究(GWAS)风险变异位于非编码区域,将调控变异与治疗假设联系起来仍然是一项重大挑战。在此,我们开发了一种整合性深度学习框架,将等位基因特异性增强子预测与以转录因子(TF)为中心的基因表达变化及药物诱导的转录谱相连接,以优先筛选候选治疗药物。我们的细胞类型特异性深度学习增强子模型能够准确区分七种细胞系中的活性增强子。以乳腺癌作为概念验证,我们发现GWAS遗传力在MCF7增强子中显著富集,支持MCF7作为该疾病的细胞背景。等位基因特异性变异评分鉴定出具有强烈等位基因依赖效应的乳腺癌风险变异,而基于归因的基序发现揭示了FOXA1相关基序特征的富集,这与原发性肿瘤中FOXA1上调的现象一致。整合FOXA1敲低诱导和药物诱导的基因表达谱后,鉴定出63种用于乳腺癌治疗的候选化合物,其中包括18种已获批药物,并成功识别出已知乳腺癌治疗药物氟维司群(fulvestrant)。在优先筛选的化合物中,54%在八条乳腺癌核心通路中表现出反相关的转录效应,而未被优先筛选的化合物中这一比例仅为5.3%。进一步整合药物—基因相互作用数据后,将候选范围细化为8种具有实验或临床证据支持的化合物。综上,这些结果建立了一种由调控变异引导的药物再利用框架,将非编码遗传变异与候选治疗药物连接起来,并为将非编码基因组转化为具有药理学相关性的假设提供了一种可推广的策略。

药物再利用为加速治疗发现提供了一种具有成本效益的策略,但大多数计算方法未能对非编码遗传变异进行建模。由于超过90%的全基因组关联研究(GWAS)风险变异位于非编码区域,将调控变异与治疗假设联系起来仍然是一项重大挑战。在此,我们开发了一种整合性深度学习框架,将等位基因特异性增强子预测与以转录因子(TF)为中心的基因表达变化及药物诱导的转录谱相连接,以优先筛选候选治疗药物。我们的细胞类型特异性深度学习增强子模型能够准确区分七种细胞系中的活性增强子。以乳腺癌作为概念验证,我们发现GWAS遗传力在MCF7增强子中显著富集,支持MCF7作为该疾病的细胞背景。等位基因特异性变异评分鉴定出具有强烈等位基因依赖效应的乳腺癌风险变异,而基于归因的基序发现揭示了FOXA1相关基序特征的富集,这与原发性肿瘤中FOXA1上调的现象一致。整合FOXA1敲低诱导和药物诱导的基因表达谱后,鉴定出63种用于乳腺癌治疗的候选化合物,其中包括18种已获批药物,并成功识别出已知乳腺癌治疗药物氟维司群(fulvestrant)。在优先筛选的化合物中,54%在八条乳腺癌核心通路中表现出反相关的转录效应,而未被优先筛选的化合物中这一比例仅为5.3%。进一步整合药物—基因相互作用数据后,将候选范围细化为8种具有实验或临床证据支持的化合物。综上,这些结果建立了一种由调控变异引导的药物再利用框架,将非编码遗传变异与候选治疗药物连接起来,并为将非编码基因组转化为具有药理学相关性的假设提供了一种可推广的策略。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.11.724354v1?rss=1

🏷️ 药物再利用 深度学习 基因调控 GWAS 非编码变异 乳腺癌