可解释人工智能将 H3K18ac 识别为活性增强子的一个新标志|||北京沫之东生物技术有限公司

4 次围观

增强子是调控基因转录的非编码DNA区域，然而增强子活性的潜在机制仍未被完全阐明。尽管已经开展了大量实验和计算研究，我们在许多人类细胞、组织及疾病背景中仍缺乏准确的增强子图谱。在此，我们开发了多种人工智能（AI）模型［卷积神经网络（CNN）、XGBoost、逻辑回归（LR）以及一种基于可解释人工智能的二型模糊逻辑系统（type2-FLS）］，用于预测不同人类和小鼠细胞系中的增强子。尽管所有模型在其训练所用细胞系中均表现出较高的准确性，但我们的结果证实，type2-FLS以及在一定程度上的CNN、LR和XGBoost在训练过程中未见过的细胞系中也能持续表现良好，支持了这些模型的泛化能力。最重要的是，type2-FLS鉴定出H3K18ac是一个重要的增强子标记，并识别出许多新的推定增强子，这些增强子表现出与实验鉴定增强子相同的表观遗传学特征。我们通过全局性表观遗传扰动和定向增强子表观遗传重写（CRISPRi）对其中一些新型增强子进行了验证。有趣的是，在人类中仅需7种表观遗传标记、在小鼠中仅需5种表观遗传标记，即可在不损失准确性的情况下对增强子进行注释。总体而言，我们破译了哺乳动物增强子的表观遗传密码，并在多种人类和小鼠细胞系中完成了增强子的注释。

增强子是调控基因转录的非编码DNA区域，然而，增强子活性背后的机制仍未得到完全阐明。尽管已经开展了大量实验和计算研究工作，我们在许多人类细胞、组织及疾病背景中仍然缺乏准确的增强子图谱。在本研究中，我们开发了若干人工智能（AI）模型〔卷积神经网络（CNN）、XGBoost、逻辑回归（LR）以及一种基于二型模糊逻辑系统的可解释人工智能模型（type2-FLS）〕，用于预测不同人和小鼠细胞系中的增强子。尽管所有模型在其训练所用细胞系中均表现出较高准确性，但我们的结果证实，type2-FLS，以及在一定程度上的CNN、LR和XGBoost，在训练过程中未见过的细胞系中也表现稳定良好，支持了这些模型的泛化能力。最重要的是，type2-FLS鉴定出H3K18ac是一个重要的增强子标记，并发现了许多新的潜在增强子，这些增强子表现出与实验鉴定增强子相同的表观遗传特征。我们通过全局表观遗传扰动和定向增强子表观遗传重写（CRISPRi）对其中一些新型增强子进行了验证。有趣的是，在人类中仅需7种表观遗传标记，在小鼠中仅需5种表观遗传标记，即可在不损失准确性的情况下完成增强子注释。总体而言，我们破译了哺乳动物增强子的表观遗传密码，并对多种人和小鼠细胞系中的增强子进行了注释。

📄 原文链接：https://www.biorxiv.org/content/10.64898/2026.06.09.731088v1?rss=1

🏷️ 增强子注释表观遗传标记 H3K18ac 可解释人工智能 CRISPRi验证哺乳动物基因调控

来源出处

可解释人工智能将 H3K18ac 识别为活性增强子的一个新标志 https://www.biorxiv.org/content/10.64898/2026.06.09.731088v1?rss=1