诱变文库中序列空间覆盖度的计算

root 提交于 周五, 06/19/2026 - 12:47
定向进化需要对大规模诱变文库进行筛选,但准确计算发现功能性变体所需的文库规模仍然具有挑战性。现有模型能够提供基线估计,然而当前用于寻找最佳变体的计算方法在文库复杂性增加时扩展性较差。在此,我们提出了一种可扩展的算法框架,用于精确计算饱和诱变文库中的发现概率,且无需对序列进行显式枚举。通过将变体聚合为组成对数—和分布,并在随机化区块之间应用对数空间卷积,该方法能够扩展到极其庞大的序列空间以及混合密码子方案。通过对这些计算进行反演,可以为实验设计建立绝对的数学上限。最终,该框架提供了一种快速、定量的工具,用于在实验室筛选能力限制下平衡统计覆盖度与多样性之间的权衡。最后,这一框架被实现为一个开源网络应用程序(SSCC),使研究人员能够构建异质性文库设计,并计算所需的采样深度、覆盖概率以及随机化的绝对上限。

darren.hart{at}ibs.fr

摘要 信息/历史 指标 补充材料 预览 PDF 摘要

定向进化需要筛选大规模诱变文库,但准确计算为发现功能变体所需的文库规模仍然具有挑战性。现有模型提供了基线估计,然而当前用于寻找最佳变体的计算方法在文库复杂性增加时扩展性较差。持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。 其依据 CC-BY 4.0 国际许可协议 提供。

返回顶部 上一篇 下一篇 发表于 2026 年 6 月 18 日。 下载 PDF 补充材料 电子邮件 感谢您有兴趣帮助传播 bioRxiv。 您的电子邮箱 * 您的姓名 * 发送至 * 可在单独的行中输入多个地址,或用逗号分隔。

您将通过电子邮件发送以下内容 诱变文库中序列空间覆盖率的计算 消息主题 (您的姓名)已从 bioRxiv 转发一个页面给您 消息正文 (您的姓名)认为您可能希望查看 bioRxiv 网站上的此页面。 您的个人留言 验证码 此问题用于测试您是否为人类访问者,并防止自动垃圾信息提交。

分享 诱变文库中序列空间覆盖率的计算 Alberto Florez Prada , Guido Uguzzoni , Darren J Hart

bioRxiv 2026.06.15.729752; doi: https://doi.org/10.64898/2026.06.15.729752

分享本文: 复制 引文工具

诱变文库中序列空间覆盖率的计算 Alberto Florez Prada , Guido Uguzzoni , Darren J Hart

bioRxiv 2026.06.15.729752; doi: https://doi.org/10.64898/2026.06.15.729752


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.15.729752v1?rss=1

🏷️ 定向进化 饱和诱变文库 序列空间覆盖 发现概率计算 实验设计 开源工具