- 5 次围观
仅依赖转录组数据的单细胞RNA测序整合方法,往往难以保留关系密切的细胞亚型之间的细粒度差异。因此,在原始数据中可分离的细胞群体在整合后可能会出现过度混合,从而降低生物学分辨率和可解释性。引入标记基因信息有望解决这些问题;然而,现有标记基因集合的可变性和复杂性限制了其有效应用。为此,我们提出了 scCRAFT+,一种半监督整合模型,通过虚拟对抗训练(Virtual Adversarial Training, VAT)创新性地整合标记基因信息。通过联合优化源自标记基因的监督信息与全转录组表征,VAT 在转录上相似的细胞之间施加局部预测平滑约束,从而在提升整合质量和细胞类型自动注释能力的同时,提高模型对噪声标记注释的鲁棒性。这种有针对性的方法显著提升了注释准确性和鲁棒性,尤其是在标记基因集合不完整或存在错误的情况下。基准测试表明,scCRAFT+ 相较于当前无监督和有监督整合方法均表现出更为稳定且更强的性能,从而实现了更高质量的整合以及具有生物学意义的亚细胞类型自动注释。
仅依赖转录组数据的单细胞RNA测序整合方法,往往难以保留关系密切的细胞亚型之间的细粒度差异。因此,在原始数据中可区分的细胞群体在整合后可能会发生过度混合,从而降低生物学分辨率和结果的可解释性。引入标记基因信息有望解决这些问题;然而,现有标记基因集的可变性和复杂性限制了其有效应用。为此,我们提出了scCRAFT+,一种半监督整合模型,通过虚拟对抗训练(VAT)创新性地引入标记基因信息。通过联合优化源自标记基因的监督信号和全转录组表征,VAT在转录上相似的细胞之间施加局部预测平滑性,在提高对噪声标记注释鲁棒性的同时,增强了整合质量和细胞类型自动注释能力。这种有针对性的方法显著提升了注释准确性和鲁棒性,尤其是在面对不完整或错误的标记基因集时。基准测试表明,scCRAFT+相比当前的无监督和有监督整合方法均表现出更稳定且更优的性能,从而实现了更高质量的整合以及具有生物学意义的细胞亚型自动注释。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.07.730754v1?rss=1
🏷️ 单细胞RNA测序 数据整合 半监督学习 虚拟对抗训练 细胞类型注释 标记基因
来源出处
基于虚拟对抗学习的鲁棒半监督单细胞RNA测序数据整合
https://www.biorxiv.org/content/10.64898/2026.06.07.730754v1?rss=1