在自主与协作辅助情境下评估智能体型人工智能在生物发现中的应用

root 提交于 周三, 06/10/2026 - 02:47
基于大语言模型(LLMs)的人工智能(AI)智能体的进展,提升了其执行结构化分析工作流的能力,其中包括用于生物学发现的标准生物信息学流程。然而,计算生物学很少仅由确定性的流程执行构成。生物数据集具有异质性和噪声性,而有意义的发现通常需要开放式的假设生成,以及基于多模态证据的迭代推理。这些挑战在多组学研究中尤为明显,在这类研究中,成对的分子模态和异质性的临床背景既为发现创造了机会,也带来了障碍。新兴的智能体式AI系统在多大程度上能够支持或自动化这种科学发现模式,目前仍缺乏充分理解。在此,我们利用涵盖11种癌症类型的多组学单细胞数据集,系统评估了智能体式AI在生物学发现中的能力与局限性。我们开发了多步多模态多组学智能体框架(Multistep Multimodal Multiomic Agentic Framework,M3A),以支持由LLM驱动的、基于持久化多模态数据状态的推理,并在自主模式和人机协同副驾驶模式下捕捉智能体的推理行为。借助该框架,我们评估了AI智能体在一系列互补任务中的表现,包括自主细胞类型注释、基于基因程序生成可证伪的生物学假设,以及用于检验人类参与和领域专业知识影响的人机协同实验。我们发现,当前的AI智能体在对复杂数据进行广泛、系统性的探索方面表现有效,而领域专家在方法学指导以及跨分析的生物学综合方面仍然至关重要。综上,我们的结果界定了智能体式AI在计算生物学中的当前潜力与边界,并建立了一个用于评估旨在支持生物学发现的AI系统的框架。

基于大型语言模型(LLMs)的人工智能(AI)智能体的进展,提升了其执行结构化分析工作流的能力,包括用于生物学发现的标准生物信息学流程。然而,计算生物学很少仅由确定性的流程执行构成。生物数据集具有异质性和噪声性,而有意义的发现往往需要开放式的假设生成,以及基于多模态证据的迭代推理。这些挑战在多组学研究中尤为突出,因为成对的分子模态和异质性的临床背景既为发现创造了机会,也带来了障碍。新兴的智能体型AI系统在多大程度上能够支持或自动化这种科学发现模式,仍然知之甚少。在本研究中,我们利用涵盖11种癌症类型的多组学单细胞数据集,系统评估了智能体型AI在生物学发现中的能力与局限性。我们开发了多步骤、多模态、多组学智能体框架(Multistep Multimodal Multiomic Agentic, M3A),以支持由LLM驱动的、基于持久化多模态数据状态的推理,并在自主模式和人机协同副驾模式下捕捉智能体的推理行为。借助该框架,我们评估了AI智能体在一系列互补任务中的表现,包括自主细胞类型注释、基于基因程序生成可证伪的生物学假设,以及用于测试人类参与和领域专业知识影响的人机协同实验。我们发现,当前的AI智能体擅长对复杂数据进行广泛的系统性探索,而领域专家在方法学指导以及跨分析的生物学综合方面仍然至关重要。总体而言,我们的结果界定了智能体型AI在计算生物学中的当前潜力与边界,并建立了一个用于评估旨在支持生物学发现的AI系统的框架。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.04.729919v1?rss=1

🏷️ 智能体式AI 大语言模型 多组学分析 单细胞测序 生物发现 人机协同