基因组和基因层面的趋同约束塑造了禾本科植物对环境的重复适应

root 提交于 周四, 06/04/2026 - 18:47
禾本科(Poaceae)植物主导着陆地生态系统并维系全球粮食安全,然而,使其能够反复适应极端环境的基因组学原理仍未得到解析。通过结合高密度系统发育基因组采样、全球环境数据以及基因组大语言模型(gLLMs),我们表征了跨越17个气候带、涵盖569个物种的707个基因组中环境适应所对应的突变靶标。我们鉴定出19–30次在系统发育上相互独立的向极端温度、水分和土壤环境的转变,并发现这些转变伴随着基因组尺度分子性质的趋同变化,包括氮碳平衡以及蛋白质组的生物合成成本。基于gLLMs信息构建的系统发育混合建模框架识别出330个在不同环境适应轴上反复发挥作用的基因,凸显了蛋白质修饰以及其在细胞外区室和细胞器区室内定位的重要性。对独立的趋同适应检验结果进行叠加后,我们进一步识别出17个可供后续表征的高置信度候选基因。综上,我们的结果表明,禾本科植物的适应过程受到基因组范围和基因特异性尺度上分层约束的导引,从而产生可预测的进化轨迹。

禾本科(Poaceae)植物主导着陆地生态系统并支撑全球粮食安全,然而,使其能够反复适应极端环境的基因组学原理仍未得到阐明。通过结合高密度系统基因组采样、全球环境数据以及基因组大语言模型(gLLMs),我们刻画了跨越17个气候带的569个物种、707个基因组中环境适应背后的突变靶点。我们鉴定出19–30次在系统发育上彼此独立、向极端温度、水分和土壤环境的转变,并发现这些转变伴随着基因组尺度分子属性的趋同变化,包括氮碳平衡以及蛋白质组的生物合成成本。基于gLLMs信息构建的系统发育混合建模框架鉴定出330个在不同环境适应维度中反复发挥作用的基因,突显了蛋白质修饰及其在细胞外和细胞器区室内定位的重要性。叠加独立的趋同适应检验后,我们进一步识别出17个高置信度候选基因,以供后续表征研究。总体而言,我们的结果表明,禾本科植物的适应过程受到基因组整体尺度和基因特异性尺度上分层约束的引导,从而产生可预测的进化轨迹。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.01.729361v1?rss=1

🏷️ 禾本科植物 环境适应 趋同进化 系统发育基因组学 基因组大语言模型 候选基因鉴定