- 1次围观
构建从测序读段质量控制、基因组组装到功能注释的多步骤生物信息学工作流,需要同时具备生物学知识与计算工具选择方面的专业能力,这构成了实现可扩展且可复现分析的瓶颈。我们提出了 KBase Research Agent,这是一种多智能体系统,用于在美国能源部系统生物学知识库(DOE Systems Biology Knowledgebase,KBase)中自动化此类工作流。给定一组测序读段和一个研究目标,该智能体基于 KBase 文档以及 KBase 应用目录的知识图谱(Knowledge Graph, KG)构建分析计划,随后选择、参数化、验证并执行合适的 KBase 应用以完成工作流。最终得到的分析过程被保存为可复现的 KBase Narrative。 我们将该系统的规划与执行质量,与基于同行评审期刊《Microbiology Resource Announcements》中的参考工作流所构建的真实标准进行比较评估。我们进一步将该智能体应用于来自 JGI IMG/M 数据库的 100 个此前未分析的细菌分离株基因组,在无人干预的情况下,自主完成了读段质量控制、基因组组装、利用 GTDB-Tk 进行分类学鉴定,以及后续分析,产出了带注释的基因组、可复现的 Narratives 和论文草稿。综合这些实验结果,KBase Research Agent 展示了在生产级生物信息学平台中,实现基于领域知识支撑的端到端科学工作流自动化的可行性。
构建多步骤生物信息学工作流程——从测序读段质量控制、基因组组装到功能注释——需要同时具备生物学知识和计算工具选择方面的专业能力,从而形成了可扩展且可复现分析的瓶颈。我们提出了 KBase Research Agent,这是一种多智能体系统,用于在 DOE Systems Biology Knowledgebase(KBase)中自动化此类工作流程。给定一组测序读段和一个研究目标,该智能体会基于 KBase 文档以及 KBase 应用目录的知识图谱(KG)构建分析计划,随后选择、参数化、验证并执行合适的 KBase 应用以完成工作流程。由此产生的分析结果将被保存为可复现的 KBase Narrative。
我们将系统的规划与执行质量与基于同行评审期刊《Microbiology Resource Announcements》参考工作流程构建的真实标注进行比较评估。我们进一步将该智能体应用于来自 JGI IMG/M 数据库的 100 个此前未分析的细菌分离株基因组,在无需人工干预的情况下,自主完成了读段质量控制、基因组组装、使用 GTDB-Tk 进行分类学鉴定,以及下游分析,最终生成了带注释的基因组、可复现的 Narratives 和论文草稿。在这些实验中,KBase Research Agent 展示了在生产级生物信息学平台上实现领域知识驱动的端到端科学工作流程自动化的可行性。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.01.729336v1?rss=1
🏷️ 多智能体系统 生物信息学工作流 基因组分析 自动化科学工作流 可复现研究 知识图谱
来源出处
KBase研究智能体:用于可复现基因组分析的自动化多智能体工作流构建
https://www.biorxiv.org/content/10.64898/2026.06.01.729336v1?rss=1