基于SEED的去卷积揭示赤霞珠葡萄浆果风土差异背后的花青素相关细胞程序

root 提交于 周一, 06/08/2026 - 00:47
植物组织由多样化的细胞群体构成,这些细胞群体共同促进发育、代谢、环境响应以及表型形成。尽管单细胞和单核RNA测序极大推动了植物细胞异质性的研究,但其在大规模样本队列中的应用仍受到成本、技术复杂性、组织解离限制以及通量等因素的制约。相比之下,bulk RNA-seq数据集已在不同植物物种、组织、发育阶段和环境条件下大量积累,然而,由于面向植物的解卷积框架仍然缺乏,这些数据集中蕴含的细胞类型层面信息仍难以解析。现有解卷积方法大多是在哺乳动物系统中开发的,尚未针对植物转录组特征进行系统优化,因此其在植物特异性约束条件下的适用性仍不明确。在此,我们提出了SEED,这是一种针对植物转录组数据优化的自适应解卷积框架。SEED将候选参考模板构建与七种解卷积策略相结合,并可自动识别适用于特定数据集的最优组合。在葡萄模拟基准测试中,SEED在低重复条件下表现出最明显的优势;而在评估更大规模伪bulk样本量时,其总体表现也保持了广泛竞争力,而非始终占据绝对优势。SEED在公开的拟南芥和烟草数据集中也表现出良好的稳健性。最后,我们将SEED应用于本研究生成的bulk RNA-seq数据,这些数据来源于采自银川和烟台的酿酒葡萄(Vitis vinifera cv. Cabernet Sauvignon)果实,由此识别出与风土相关的细胞亚型及协同的细胞类型互作模式。综上,这些结果确立了SEED作为植物转录组解卷积实用框架的地位,并为解析与植物环境适应和表型形成相关的细胞异质性提供了新的工具。

植物组织由多样化的细胞群体构成,这些细胞群体共同参与发育、代谢、环境响应以及表型形成。尽管单细胞和单核RNA测序极大推动了植物细胞异质性的研究,但其在大规模样本队列中的应用仍受到成本、技术复杂性、组织解离限制以及通量等因素的制约。相比之下,bulk RNA-seq数据集已在不同植物物种、组织、发育阶段和环境条件中大量积累,然而,由于面向植物的解卷积框架仍然缺乏,这些数据集中蕴含的细胞类型层面信息仍难以被解析。现有解卷积方法大多是在哺乳动物系统中开发的,尚未针对植物转录组特征进行系统优化,因此其在植物特异性约束条件下的适用性仍不明确。

在此,我们提出SEED,一种针对植物转录组数据优化的自适应解卷积框架。SEED将候选参考模板构建与七种解卷积策略相结合,并能够针对给定数据集自动识别最优组合。在葡萄藤模拟基准测试中,SEED在低重复条件下表现出最明显的优势;而在评估更大规模伪bulk样本量时,其整体表现仍具有广泛竞争力,但并非在所有情况下都占据绝对优势。SEED在公开的拟南芥(Arabidopsis thaliana)和烟草(Nicotiana tabacum)数据集中也表现出良好的稳健性。

最后,我们将SEED应用于本研究生成的bulk RNA-seq数据,这些数据来源于采自银川和烟台的欧亚种葡萄(Vitis vinifera cv. Cabernet Sauvignon)浆果,并鉴定出与风土相关的细胞亚型及其协调的细胞类型互作模式。综上,这些结果确立了SEED作为植物转录组解卷积实用框架的地位,并为解析与植物环境适应和表型形成相关的细胞异质性提供了新的工具。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.05.730035v1?rss=1

🏷️ 植物转录组解卷积 bulk RNA-seq 单细胞参考 葡萄浆果花青素 风土差异 细胞异质性