大语言模型在代谢工程中对基因组尺度代谢模型解释与分析能力的综合评估

root 提交于 周二, 06/09/2026 - 16:47
基因组尺度代谢模型(GSM)通过将基因与代谢反应关联起来,并支持对细胞通量及干预效应进行系统层面的模拟,从而为通路工程与菌株工程提供基础支撑。然而,端到端分析工作流仍然较为碎片化,对专业知识依赖较高,且适应新需求的速度较慢。大型语言模型(LLM)有望改变这一局面:它们能够解释相关概念、解析GSM文件,并将自然语言指令转换为有效的分析代码,从而显著降低所需的时间、精力和专业门槛。然而,其在领域特定任务中的可靠性仍未得到充分探索。本文系统性地基准评测了四种领先的LLM(GPT-4、Gemini、Claude、DeepSeek-R1)在代谢工程四类核心任务中的表现:领域知识、代谢通量预测、通路构建和通量优化。为开展基准评测,我们提出了一个标准化的、基于评分量表的评估框架,采用多LLM自动评分(即由多个LLM组成的“LLM-as-a-judge”评审集成),并设计了两套不同的、面向任务定制的九项指标体系(分别对应领域任务和编码任务),按1–5分评分(每项任务最高45分),在适用情况下同时覆盖科学有效性与代码可执行性。 在各类任务中,我们揭示了LLM的稳定优势(概念解释、代码生成)以及关键失效模式(如上下文窗口限制、对标识符的错误假设、依赖菌株背景的推理错误,以及领域特定算法中的错误)。总体而言,DeepSeek-R1在领域任务中表现最佳,以微弱优势领先于GPT-4、Claude和Gemini,表明概念性生物学逻辑在不同模型架构之间具有高度稳定性。相比之下,Gemini在编码任务中获得最高分,其优势体现在功能执行能力,并且在错误处理、文档质量和可读性方面表现突出,其后依次为GPT-4、Claude和DeepSeek。我们还通过注入细微但后果显著的错误来评估LLM的自检能力:包括一个导致质量失衡的化学计量符号错误,以及一个遗漏的通路反应。结果表明,基于对话式“盲目搜索”的提示方法完全无法定位这些网络错误。相反,要实现稳健的错误定位,必须将提示重构为带有领域知识约束的形式,迫使LLM借助工具辅助的代码流程,例如使用COBRApy的质量平衡函数。综上,本研究为LLM赋能的GSM分析建立了一个基于证据的基线,并为构建可靠、可自动化的通路与菌株设计工作流提供了可操作的指导。

代谢工程中用于解释与分析基因组尺度代谢模型的大语言模型能力综合评估 | bioRxiv

跳转至主要内容 首页 关于 提交 提醒 / RSS 搜索此关键词 高级搜索 新结果

代谢工程中用于解释与分析基因组尺度代谢模型的大语言模型能力综合评估

Jing Wui Yeoh, C. Pawan K. Patro, Limsoon Wong, Chueh Loo Poh

doi: https://doi.org/10.64898/2026.06.03.730004

Jing Wui Yeoh 新加坡国立大学 在 Google Scholar 上查找此作者 在 PubMed 上查找此作者 在持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。 本文依据 CC-BY-NC 4.0 国际许可协议 发布。

查看讨论主题。

返回顶部 上一页 下一页

发布于 2026 年 6 月 8 日。

下载 PDF 补充材料 电子邮件

感谢您有兴趣帮助传播 bioRxiv 的内容。 您的电子邮件 *

您的姓名 *

发送至 *

输入多个地址时,请分行填写或使用逗号分隔。

您将通过电子邮件发送以下内容 代谢工程中用于解释与分析基因组尺度代谢模型的大语言模型能力综合评估

邮件主题 (您的姓名)已从 bioRxiv 转发一个页面给您

邮件正文 (您的姓名)认为您可能希望查看 bioRxiv 网站上的此页面。

您的个性化留言

验证码 此问题用于测试您是否为人类访客,并防止自动化垃圾信息提交。

分享

代谢工程中用于解释与分析基因组尺度代谢模型的大语言模型能力综合评估

Jing Wui Yeoh, C. Pawan K. Patro, Limsoon Wong, Chueh Loo Poh

bioRxiv 2026.06.03.730004; doi: https://doi.org/10.64898/2026.06.03.730004

分享本文: 复制

引用工具

代谢工程中用于解释与分析基因组尺度代谢模型的大语言模型能力综合评估

Jing Wui Yeoh, C. Pawan K. Patro, Limsoon Wong, Chueh Loo Poh

bioRxiv 2026.06.03.730004; doi: https://doi.org/10.64898/2026.06.03.730004


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.03.730004v1?rss=1

🏷️ 大语言模型 代谢工程 基因组尺度代谢模型 通量分析 基准评测 COBRApy