- 2 次围观
温度是生物系统的一项基本约束,然而这种约束如何反映在基因组序列组织中仍不明确。本文表明,全基因组范围内短DNA序列的分布包含一种稳健的热适应信号,并且该信号在很大程度上独立于系统发育关系。我们采用结构主题模型(Structural Topic Modelling, STM)这一用于识别共同出现序列基序群的机器学习方法,分析细菌和古菌基因组代理(随机抽样的基因组区域)的标准6-mer和9-mer频率谱,并识别出与嗜热生物和嗜冷生物系统性相关的基序家族。在嗜热细菌中,所识别的基序家族主要由高度特异、过度富集且共同出现的C和G堆叠型六聚体构成,并存在一个在多种温度比较中反复出现的、具有CG周期性的独特六聚体家族。相较之下,与嗜冷细菌相关的基序则主要由低复杂度的A、T以及AT连续串六聚体所主导。嗜热古菌通常表现出一种以CTAG为中心的独特六聚体家族,这表明不同生物域可能通过不同的序列层面解决方案来适应相似的环境约束。然而,这种生物域层面的对比并非绝对:在针对两对嗜热细菌—古菌配对的定向分析中,我们发现所有由STM识别的嗜热相关六聚体家族在频率上表现出异常相似性,这表明在某些特定情况下,共享的高温环境能够部分压倒系统发育分化。值得注意的是,这些被识别出的基序家族仅构成广阔的可能G+C富集或A+T富集序列空间中的一小部分且高度选择性的子集。这说明,热适应与特定的序列结构架构相关,而非仅仅体现为核苷酸组成的广泛变化。因此,所观察到的信号不能仅由整体碱基组成来解释,而是源于短序列语境中核苷酸的结构化组合及其位置排列。在k=6和k=9两种情况下都恢复出了相关的基序家族,这表明该信号反映的是全基因组范围内序列组织的系统性变化,而非孤立的单个序列基序。这些模式与生化和生物物理研究中已知的、依赖序列的DNA物理性质相一致,包括碱基堆叠相互作用和构象柔性方面的差异。综上,我们的结果表明,全基因组序列组织反映了与热适应相关的、依赖序列的DNA物理性质,揭示了系统发育历史之外一个此前未被充分重视的基因组信息物理层。
本网站正在使用一项安全服务来保护自身免受在线攻击。您刚刚执行的操作触发了该安全解决方案。可能触发此拦截的行为有多种,包括提交某些特定词语或短语、SQL 命令或格式错误的数据。
您可以向网站所有者发送电子邮件,告知您已被拦截。请在邮件中说明该页面出现时您正在进行的操作,并附上本页面底部显示的 Cloudflare Ray ID。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.16.732181v1?rss=1
🏷️ 热适应 全基因组序列模式 DNA物理性质 短序列基序 结构主题模型 嗜极微生物
来源出处
超越系统发育:全基因组DNA序列模式表明,与嗜极微生物热适应相关的DNA物理性质
https://www.biorxiv.org/content/10.64898/2026.06.16.732181v1?rss=1