- 2 次围观
我们介绍 Ontologizer 3,这是一款易于使用的跨平台桌面应用程序,用于进行基因本体(Gene Ontology, GO)过度代表性分析。 Ontologizer 3 提供了两种互补的方法。第一种是频率学派方法,使用单侧 Fisher 精确检验对 GO 术语逐一进行评估,从而得到术语层面的显著性值。第二种是贝叶斯方法,利用基于模型的基因集分析(model-based gene set analysis, MGSA)对术语进行联合评估,从而得到术语层面的后验概率。 由于 GO 的层级结构会导致已注释基因集之间存在大量重叠,这两种方法会产生不同的结果。频率学派方法往往会报告一长串注释重叠程度很高的术语,而 MGSA 则产生一组更为简约的术语,用以解释所观察到的基因活性。 基于具有已知真实标注的模拟数据,我们表明这两种方法都能够可靠地识别因果术语,但 MGSA 能够实现显著更高的精确率。 Ontologizer 3 被实现为一个 Tauri 应用程序,采用 Rust 后端和 Angular 前端,并以表格和图形两种形式展示富集术语。该软件依据 MIT 许可证免费提供,获取地址为 https://github.com/P2GX/ontologizer-gui。适用于 Macintosh、Windows 和基于 Debian 的 Linux 的安装包可在 GitHub Releases 页面获得。
我们介绍 Ontologizer 3,这是一款易于使用的跨平台桌面应用程序,用于基因本体(Gene Ontology, GO)过度代表性分析。
Ontologizer 3 提供了两种互补的方法。第一种是频率学派方法,使用单侧 Fisher 精确检验对 GO 术语逐一进行评估,从而得到术语层面的显著性值。第二种是贝叶斯方法,使用基于模型的基因集分析(model-based gene set analysis, MGSA)对术语进行联合评估,从而得到术语层面的后验概率。由于 GO 的层级结构导致已注释基因集之间存在大量重叠,这两种方法会产生不同的结果。频率学派方法倾向于报告一长串注释重叠程度较高的术语,而 MGSA 则产生一组简约的术语,用于解释观测到的基因活性。
利用具有已知真实值的模拟数据,我们表明这两种方法都能够可靠地识别因果术语,但 MGSA 实现了显著更高的精确率。Ontologizer 3 被实现为一个 Tauri 应用程序,采用 Rust 后端和 Angular 前端,并以表格和图形形式展示富集术语。该软件依据 MIT 许可证免费提供,地址为 https://github.com/P2GX/ontologizer-gui。适用于 Macintosh、Windows 和基于 Debian 的 Linux 的安装包可在 GitHub Releases 页面获取。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.04.730045v1?rss=1
🏷️ 基因本体 GO富集分析 过度代表性分析 贝叶斯方法 MGSA 桌面生物软件
来源出处
Ontologizer 3:一个用于频率学派与贝叶斯 GO 富集分析的跨平台桌面应用程序
https://www.biorxiv.org/content/10.64898/2026.06.04.730045v1?rss=1