- 3 次围观
基因集富集分析(Gene Set Enrichment Analysis, GSEA)是转录组分析中最常用的方法之一,然而当生物通路表现出异质性或不一致的表达模式时,其统计功效会受到限制。我们提出了一种改进的 GSEA 方法,即基于积分的 GSEA(integral-based GSEA, inGSEA)。inGSEA 引入了一种新的富集评分,该评分基于 Anderson-Darling 加权积分统计量。新的富集评分提高了对复杂信号的检测能力,尤其是稀疏和双向信号;同时,对积分统计量与经典最大统计量采用 Cauchy 组合,使该方法在多样化的表达模式下具有稳健性。大量数值研究表明,inGSEA 具有更优的检验功效,并能够良好校准假阳性发现。真实数据集上的应用显示,inGSEA 能够发现标准 GSEA 所遗漏的、具有生物学意义的通路。inGSEA 通过采用广义 Gamma 分布近似零分布,降低了置换检验的计算负担。inGSEA 以用户友好的网页软件工具形式提供(https://amss-stat.github.io/inGSEA)。
基因集富集分析(Gene Set Enrichment Analysis, GSEA)是转录组分析中最常用的方法之一,然而当生物通路呈现异质性或非一致性表达模式时,其统计功效受到限制。我们提出了一种改进的 GSEA 方法,即基于积分的 GSEA(integral-based GSEA, inGSEA)。inGSEA 引入了一种新的富集评分,该评分基于 Anderson-Darling 加权积分统计量。新的富集评分提高了对复杂信号的检测能力,尤其适用于稀疏和双向信号;同时,通过将积分统计量与经典最大统计量进行 Cauchy 组合,该方法在多样化的表达模式下具有良好的稳健性。大量数值研究表明,inGSEA 具有更高的检验功效,并能较好地校准假阳性发现。对真实数据集的应用显示,inGSEA 能够识别出标准 GSEA 所遗漏的、具有生物学意义的通路。inGSEA 通过采用广义伽马分布近似零分布,降低了置换检验的计算负担。inGSEA 已作为一个用户友好的网页软件工具公开提供(https://amss-stat.github.io/inGSEA)。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.02.729106v1?rss=1
🏷️ 基因集富集分析 转录组分析 加权积分统计量 通路富集 生物信息学方法 统计检验
来源出处
inGSEA:一种使用加权积分统计量进行基因集富集分析的改进方法
https://www.biorxiv.org/content/10.64898/2026.06.02.729106v1?rss=1