基于物理指导的内在无序蛋白质设计

root 提交于 周三, 06/03/2026 - 04:47
内在无序蛋白区域(intrinsically disordered protein regions, IDPs)广泛存在于整个生命树中,其特征在于缺乏稳定的三维折叠,并通过庞大的构象集合来编码功能。这种可塑性使得IDP的理性设计具有挑战性。近年来,基于物理的方法不断涌现,能够捕捉序列组成、电荷排布以及分子相互作用等不同方面,并已成为预测由构象集合决定性质的有力工具。在此,我们提出了一个用于蛋白质组尺度从头设计IDP的机器学习框架,其核心是对基于物理的模型进行理性反演。 首先,我们对IDP进行编程,使其能够以可调控的方式感知并响应多种生物物理线索,并表明IDP的构象集合能够直接编码复杂的信号处理功能,包括阈值检测、带通滤波以及布尔型多输入逻辑。随后,我们构建了多组分IDP混合体系,并赋予其定制化的涌现凝聚体性质,包括分层结构与相数、组成特异性,以及由RNA依赖的结构与组成重塑。最后,我们证明了所设计的IDP能够在活细胞中选择性地分配进入生物凝聚体或从中耗减。 总体而言,我们的框架确立了一种灵活且可扩展的策略,用于设计动态生物分子中由构象集合决定的性质和群体性性质。

内在无序蛋白区域(intrinsically disordered protein regions, IDPs)广泛存在于生命之树的各个分支中,其特征是缺乏稳定的三维折叠,而是通过庞大的构象集合来编码功能。这种可塑性使得IDP的理性设计极具挑战性。近年来,基于物理的研究方法不断发展,能够捕捉序列组成、电荷排布和分子相互作用等不同方面的特征,并已成为预测源自构象集合性质的有力工具。在此,我们提出了一个机器学习框架,通过对基于物理的模型进行理性反演,实现蛋白质组尺度的IDP从头设计。

我们首先对IDP进行程序化设计,使其能够以可调方式感知并响应多种生物物理线索,并表明IDP的构象集合可以直接编码复杂的信号处理功能,包括阈值检测、带通滤波以及布尔型多输入逻辑。

随后,我们构建了具有定制化涌现凝聚体性质的多组分IDP混合体系,包括层化与相数、组成特异性,以及由RNA依赖性驱动的结构与组成重塑。

最后,我们展示了经过设计的IDP能够在活细胞中选择性地分配进入生物凝聚体,或从中耗竭。

综上,我们的框架确立了一种灵活且可扩展的策略,用于设计动态生物分子中源自构象集合的性质和群体性质。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.29.728696v1?rss=1

🏷️ 内在无序蛋白 蛋白质设计 生物凝聚体 机器学习 构象集合 相分离