- 2 次围观
我们对调控基因表达机制的理解,一直受限于我们对于哪些转录因子(TF)在基因组中的哪些位置发生结合这一问题认识不足,而这种结合具有很强的细胞类型特异性。尽管可以在单个细胞类型中对单个TF进行全基因组范围的TF结合实验测定,但要在数百种细胞类型中全面描绘超过1600种TF的所有组合,在实践上是难以实现的。 在本研究中,我们开发了一个精简的平台 `textit{TFBlearner}`,用于训练TF特异性模型并基于ATAC-seq数据预测结合位点。我们重点关注具有生物学动机的特征工程,并利用TF协同作用以及跨细胞类型的结合相似性,以可扩展的方式在未见过的细胞类型中实现了最先进的结合预测性能。基于此,我们构建了一个包含1108种染色质相关蛋白(其中960种为TF)在43种人类细胞类型中的结合预测汇编,这些细胞类型包括常用细胞系以及代表所有主要人类细胞谱系的36种生理性细胞类型。我们展示了这些模型如何进一步提供关于TF的生物学见解,并说明了这些结合预测如何用于下游任务,例如TF活性推断。 我们的研究还进一步观察到TF占据具有高度的广泛性。为研究非特异性占据,我们在不同细胞类型中表征了拥挤区域或高占据(HOT)区域,提供了其功能性的证据,并报告了重要的细胞类型特异性。最后,我们表明,在不同细胞类型中,拥挤区域参与了更多的三维接触,并且在拥挤启动子处的大多数TF占据都可以解释为来自远端调控元件的牵连性结合。
本网站正在使用一项安全服务来保护其免受在线攻击。您刚刚执行的操作触发了该安全解决方案。可能触发此拦截的行为有多种,包括提交某些特定的单词或短语、SQL 命令或格式错误的数据。
您可以向网站所有者发送电子邮件,告知其您已被拦截。请在邮件中说明该页面出现时您正在进行的操作,并附上本页面底部显示的 Cloudflare Ray ID。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.16.732527v1?rss=1
🏷️ 转录因子结合预测 ATAC-seq 调控基因组学 染色质接触 HOT区域 跨细胞类型建模
来源出处
跨人类细胞类型的大规模转录因子结合预测为调控基因组学提供了信息,并揭示了与染色质接触相关的广泛占据现象
https://www.biorxiv.org/content/10.64898/2026.06.16.732527v1?rss=1