预测效应基因聚合、标准与统一模式(PEGASUS):效应基因报告的社区框架

root 提交于 周四, 06/18/2026 - 02:47
全基因组关联研究(GWAS)日益报告预测效应基因(predicted effector genes, PEGs)——即被假定介导相关变异生物学效应的基因。这些基因构成了推进“变异到功能”研究、机制性理解以及治疗发现的关键产出。然而,PEG 列表的快速增长并未伴随用于组织、注释和报告这些预测结果的标准同步建立。正如近期的全景分析所示,PEG 列表在方法学、证据定义、命名规范、来源追踪以及数据结构等方面存在广泛差异,从而限制了互操作性、基准评测、重复利用以及对 FAIR 原则的遵循。为弥补这一缺口,我们召集了一个国际多方利益相关者共同体,成员包括方法开发者、数据生成者、资源维护者、策展人、资助方、期刊编辑以及下游用户。通过 2024 年的一次研讨会和 2025 年的一系列工作组会议,我们开发了预测效应基因聚合、标准与统一模式(Predicted Effector Gene Aggregation, Standards and Unified Schema, PEGASUS)框架。PEGASUS 规定了:(i)一种元数据标准,用于记录来源信息、性状和 GWAS 描述符、证据来源以及整合方法;(ii)一种结构化证据矩阵,用于报告每个位点中所有基因以及支撑优先级排序的全部证据;以及(iii)一份简明的 PEG 列表,用于概括作者优先选定的基因,并将其透明地链接到底层证据。该框架在透明性、机器可读性、提交者负担以及与现有社区标准的一致性之间取得了平衡。PEGASUS 提供了首个由社区共同开发的、用于报告预测效应基因及其支持证据的模式。作者采用该框架将提高不同研究间 PEG 结果的可比性、可重复性和可重用性,促进更稳健的生物学推断,支持基因优先级排序方法的跨资源比较以开展社区基准评测,并促进其整合进入下游资源和分析流程。符合 PEGASUS 规范的数据可通过 PEG Data Registry 平台(https://kpndataregistry.org/peg)共享,从而促进再利用,并为未来与公开共享的 GWAS 数据整合奠定基础。

本网站正在使用一项安全服务来保护自身免受在线攻击。您刚才执行的操作触发了该安全防护机制。可能触发此拦截的行为包括提交某些特定的词语或短语、SQL 命令或格式错误的数据。

您可以向网站所有者发送电子邮件,告知您被拦截的情况。请在邮件中说明此页面出现时您正在进行的操作,并附上本页底部显示的 Cloudflare Ray ID。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.16.731894v1?rss=1

🏷️ 全基因组关联研究 效应基因预测 数据标准化 元数据模式 FAIR原则