- 3 次围观
增强子是调控基因转录的非编码DNA区域,然而增强子活性的潜在机制仍未被完全阐明。尽管已经开展了大量实验和计算研究,我们在许多人类细胞、组织及疾病背景中仍缺乏准确的增强子图谱。在此,我们开发了多种人工智能(AI)模型[卷积神经网络(CNN)、XGBoost、逻辑回归(LR)以及一种基于可解释人工智能的二型模糊逻辑系统(type2-FLS)],用于预测不同人类和小鼠细胞系中的增强子。尽管所有模型在其训练所用细胞系中均表现出较高的准确性,但我们的结果证实,type2-FLS以及在一定程度上的CNN、LR和XGBoost在训练过程中未见过的细胞系中也能持续表现良好,支持了这些模型的泛化能力。最重要的是,type2-FLS鉴定出H3K18ac是一个重要的增强子标记,并识别出许多新的推定增强子,这些增强子表现出与实验鉴定增强子相同的表观遗传学特征。我们通过全局性表观遗传扰动和定向增强子表观遗传重写(CRISPRi)对其中一些新型增强子进行了验证。有趣的是,在人类中仅需7种表观遗传标记、在小鼠中仅需5种表观遗传标记,即可在不损失准确性的情况下对增强子进行注释。总体而言,我们破译了哺乳动物增强子的表观遗传密码,并在多种人类和小鼠细胞系中完成了增强子的注释。
增强子是调控基因转录的非编码DNA区域,然而,增强子活性背后的机制仍未得到完全阐明。尽管已经开展了大量实验和计算研究工作,我们在许多人类细胞、组织及疾病背景中仍然缺乏准确的增强子图谱。在本研究中,我们开发了若干人工智能(AI)模型〔卷积神经网络(CNN)、XGBoost、逻辑回归(LR)以及一种基于二型模糊逻辑系统的可解释人工智能模型(type2-FLS)〕,用于预测不同人和小鼠细胞系中的增强子。尽管所有模型在其训练所用细胞系中均表现出较高准确性,但我们的结果证实,type2-FLS,以及在一定程度上的CNN、LR和XGBoost,在训练过程中未见过的细胞系中也表现稳定良好,支持了这些模型的泛化能力。最重要的是,type2-FLS鉴定出H3K18ac是一个重要的增强子标记,并发现了许多新的潜在增强子,这些增强子表现出与实验鉴定增强子相同的表观遗传特征。我们通过全局表观遗传扰动和定向增强子表观遗传重写(CRISPRi)对其中一些新型增强子进行了验证。有趣的是,在人类中仅需7种表观遗传标记,在小鼠中仅需5种表观遗传标记,即可在不损失准确性的情况下完成增强子注释。总体而言,我们破译了哺乳动物增强子的表观遗传密码,并对多种人和小鼠细胞系中的增强子进行了注释。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.09.731088v1?rss=1
🏷️ 增强子注释 表观遗传标记 H3K18ac 可解释人工智能 CRISPRi验证 哺乳动物基因调控
来源出处
可解释人工智能将 H3K18ac 识别为活性增强子的一个新标志
https://www.biorxiv.org/content/10.64898/2026.06.09.731088v1?rss=1