群体尺度免疫细胞转录组的层次分类

root 提交于 周五, 06/05/2026 - 08:47
准确的免疫细胞分类对于解读单细胞RNA测序(scRNA-seq)数据至关重要。然而,相关进展受到缺乏独立、高分辨率基准的限制,因为常规的数据集整合会引入统计依赖性,从而人为夸大模型的泛化能力。在此,我们提出单细胞通用分类总库(single-cell universal classification omnibus,Suco),这一资源提供独立且统一的专家注释;同时提出Compocyte,一种模块化层级分类器。二者共同构建了一个适用于人群免疫学研究规模的框架。 该方法在显著优于现有分类器的同时,还促进了专家对模糊注释的审查。通过在50项研究中应用Compocyte(其中包括3个新生成的数据集),我们对来自3,965名患者的1,560万白细胞进行了分类。在这一大规模队列中,我们鉴定出一种新的肿瘤相关吸收性巨噬细胞表型、亚临床细胞因子释放综合征中的一种非常规单核细胞亚型,以及T细胞记忆干性在转移部位的程序性侵蚀。因此,Suco和Compocyte提供了一种通用化的架构和基准,能够支持在大规模临床队列中开展高分辨率注释。

准确的免疫细胞分类对于解读单细胞RNA测序(scRNA-seq)数据至关重要。然而,相关进展受限于缺乏独立的高分辨率基准,因为数据集的常规整合会引入统计依赖性,从而人为夸大模型的泛化能力。在此,我们提出单细胞通用分类总库(single-cell universal classification omnibus,Suco),这一资源提供独立且统一的专家注释;同时提出Compocyte,一种模块化层级分类器。二者共同建立了一个面向人群免疫学研究规模的框架。

该方法在显著优于现有分类器的同时,还促进了专家对模糊注释的审查。通过将Compocyte应用于50项研究(包括3个新生成的数据集),我们对来自3,965名患者的1,560万白细胞进行了分类。在这一大规模队列中,我们鉴定出一种新的肿瘤相关吸收性巨噬细胞表型、一种出现在亚临床细胞因子释放综合征中的非经典单核细胞亚型,以及T细胞记忆干性在转移灶之间的程序性侵蚀。因此,Suco和Compocyte提供了一种具有良好泛化能力的架构和基准,能够支持在大规模临床队列中开展高分辨率注释。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.30.728980v1?rss=1

🏷️ 单细胞RNA测序 免疫细胞分类 层级分类器 转录组分析 白细胞异质性 肿瘤相关巨噬细胞