长读长RNA测序解析牛复杂性状在异构体水平和特定情境下的调控架构

root 提交于 周五, 06/05/2026 - 20:47
传统短读长 RNA-seq 缺乏足够分辨率,无法完整捕获全长异构体和复杂可变剪接,从而在现有分子图谱中留下了“缺失调控”的空白。在此,我们基于来自四个不同泌乳阶段的 432 头奶牛的配对深度全基因组测序(30×)、长读长(ONT)和短读长 RNA-seq 以及代谢组数据,开展了群体尺度、多组学层面的牛复杂性状解析。我们扩展了牛转录图谱,鉴定出 13,177 个新异构体,并在 11 种多样化分子表型中精细定位了 1,088,900 个调控效应。值得注意的是,长读长比对揭示了 606 个具有异构体表达数量性状位点(isoform eQTL,12.8%)的基因,以及 1,116 个具有精细剪接数量性状位点(sQTL,31.8%)的基因,而这些均被传统短读长比对所遗漏。我们进一步表明,泌乳特异性调控在很大程度上由代谢微环境(46.8%)和细胞组成(4.3%)所介导。在针对 90 种牛复杂性状的全基因组关联分析(GWAS)中,异构体水平及情境特异性的调控效应捕获了被短读长 eQTL 和 sQTL 分析遗漏的 GWAS 位点,使共定位位点比例由 35.2% 提升至 60.3%。这些调控变异还与人类免疫和代谢相关位点表现出进化约束关系。我们的研究建立了一项极具价值的资源(https://cattleblr.farmgtex.org),并表明长读长转录组学对于解析哺乳动物生理基础调控机制的复杂性至关重要。

传统短读长 RNA-seq 缺乏充分捕获全长异构体和复杂可变剪接的分辨率,从而在现有分子图谱中留下了“缺失调控”的空白。在此,我们利用来自 432 头奶牛、覆盖四个不同泌乳阶段的配对深度全基因组测序(30×)、长读长(ONT)与短读长 RNA-seq 以及代谢组数据,对牛复杂性状进行了群体尺度的多组学解析。我们扩展了牛转录组图谱,新增 13,177 个异构体,并在 11 种多样化分子表型中精细定位了 1,088,900 个调控效应。值得注意的是,长读长比对揭示了 606 个具有异构体表达数量性状位点(isoform expression quantitative trait loci, eQTL)的基因(12.8%)以及 1,116 个具有精细剪接数量性状位点(sQTL)的基因(31.8%),而这些均被传统短读长比对所遗漏。我们进一步表明,泌乳特异性调控在很大程度上受代谢微环境(46.8%)和细胞组成(4.3%)介导。在针对 90 种牛复杂性状的全基因组关联研究(GWAS)中,异构体水平和情境特异性的调控效应捕获了被短读长 eQTL 和 sQTL 分析遗漏的 GWAS 位点,使共定位位点比例从 35.2% 提升至 60.3%。这些调控变异还与人类免疫和代谢相关位点表现出进化约束。我们的研究建立了一个极具价值的资源库(https://cattleblr.farmgtex.org),并表明长读长转录组学对于解析哺乳动物生理功能背后复杂调控机制至关重要。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.04.730050v1?rss=1

🏷️ 长读长RNA测序 异构体调控 可变剪接 eQTL/sQTL 牛复杂性状 多组学整合