- 3 次围观
可变剪接异构体的使用能够在独立于基因总体表达水平的情况下改变基因功能,因此有必要在单细胞分辨率下解析转录本异构体。长读长单细胞 RNA 测序通过将细胞身份与转录本异构体及序列层面的特征相联系,满足了这一需求。要充分实现其生物学价值,需要可重复的工作流程,将专门的长读长分析与生物学解释连接起来。现有基于大语言模型(LLM)的生物医学智能体支持通用组学分析,但并非为异构体分辨的长读长单细胞工作流程而设计。在此,我们提出 scIsoAgent,这是一种由大语言模型驱动、用于长读长单细胞 RNA-seq 分析的自主科学智能体。scIsoAgent 利用阶段感知规划和持久化计算上下文,将异质性的长读长单细胞输入转化为可追踪的异构体分辨工作流程,并同时支持执行与解释。在多种互补性评估中,与通用型 LLM 基线相比,这一设计提升了从分析规划到可执行、可交互工作流程的连续性。在真实数据再分析中,scIsoAgent 重现了已发表长读长单细胞资源中的主要发现,并将一个具有代表性的差异转录本使用事件扩展为一个结合序列信息的功能性假设。通过将全长异构体序列与模型推断的转录本属性相连接,scIsoAgent 将观察到的异构体使用模式与潜在的序列层面功能后果联系起来。这些结果表明,自主科学智能体能够将碎片化的长读长单细胞分析转变为连贯、可重复的工作流程,用于异构体分辨的发现与生物学解释。
可变异构体的使用可以在不依赖基因总表达量变化的情况下改变基因功能,因此需要在单细胞分辨率下解析转录本异构体。长读长单细胞RNA测序通过将细胞身份与转录本异构体及序列层面的特征相联系,满足了这一需求。要充分实现其生物学价值,需要可重复的工作流程,以将专门的长读长分析与生物学解释相衔接。现有基于大语言模型(LLM)的生物医学智能体支持通用组学分析,但并非为异构体分辨的长读长单细胞工作流程而设计。在此,我们提出scIsoAgent,这是一种由LLM驱动、面向长读长单细胞RNA-seq分析的自主科学智能体。scIsoAgent利用阶段感知规划和持久化计算上下文,将异质性的长读长单细胞输入转化为可追溯的异构体分辨工作流程,从而同时支持分析执行与结果解释。
在互补性的多项评估中,与通用型LLM基线相比,该设计提升了从分析规划到可执行、可交互工作流程的连续性。在真实数据的再分析中,scIsoAgent重现了已发表长读长单细胞资源中的主要发现,并将一个具有代表性的差异转录本使用事件扩展为一个结合序列信息的功能性假说。通过将全长异构体序列与模型推断的转录本属性相连接,scIsoAgent建立了观测到的异构体使用模式与潜在序列层面功能后果之间的联系。这些结果表明,自主科学智能体能够将碎片化的长读长单细胞分析转化为连贯、可重复的工作流程,从而支持异构体分辨的发现与生物学解释。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.11.731519v1?rss=1
🏷️ 长读长单细胞RNA测序 转录本异构体 可变剪接 大语言模型智能体 自主组学分析
来源出处
scIsoAgent实现了长读长单细胞转录组的自主同工型解析表征与序列信息驱动的解读
https://www.biorxiv.org/content/10.64898/2026.06.11.731519v1?rss=1