高估零样本适应度预测:广泛基准掩盖了局部失效与实际局限性

root 提交于 周一, 06/08/2026 - 20:47
深度学习模型已成为蛋白质工程中探索突变景观的有前景工具。这些模型可用于在无需针对特定任务进行训练的情况下预测突变适应度,这一过程被称为零样本预测。然而,它们的实际效用仍仅得到部分表征。本文在一系列基准测试条件下评估了一组蛋白质序列与结构模型的零样本表现,重点关注那些使总体指标解释复杂化的因素。我们表明,输入模态(序列与结构)并不决定其在表型任务上的表现。相反,模型表现对实验变异性较为敏感,并且受到表型与蛋白质丰度之间相关性的显著混杂影响。尽管现有模型可作为粗略筛选器,将适应性突变与有害突变区分开来,但它们无法对一组适应性突变进行有意义的排序,也无法优先识别自然界中尚不存在的新功能。归根结底,基于蛋白质模型的零样本预测在实际应用中的效用,比总体基准测试所暗示的范围更为有限。

深度学习模型已成为蛋白质工程中探索突变景观的有前景工具。这些模型可用于在无需针对特定任务进行训练的情况下预测突变适应度,这一过程被称为零样本预测。然而,它们的实际效用仍仅得到部分刻画。

在此,我们评估了一组蛋白质序列与结构模型在一系列基准测试条件下的零样本表现,重点关注那些使总体指标解释复杂化的因素。我们表明,输入模态(序列与结构)并不决定其在表型任务上的表现。相反,模型表现对实验变异性较为敏感,并且受到表型与蛋白质丰度之间相关性的严重混杂。

尽管现有模型可以作为粗略筛选器,将适应性突变与有害突变区分开来,但它们无法对一组适应性突变进行有意义的排序,也无法优先识别自然界中尚不存在的新功能。归根结底,基于蛋白质模型的零样本预测在实际中的效用,比总体基准测试结果所暗示的范围更为有限。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.04.730121v1?rss=1

🏷️ 蛋白质工程 零样本预测 突变适应度 深度学习 蛋白质模型 基准评估