Hashi:连接统计模型导出的1D微观状态编码与蛋白质3D结构集合

root 提交于 周三, 06/03/2026 - 04:47
蛋白质的功能与其在天然态系综中所采样的构象状态密切相关。因此,如何从单一静态结构生成系综,已成为一个备受关注的研究领域。在这篇应用说明中,我们介绍了 Hashi——一条可基于构象结构的 Wako-Saito-Munoz Eaton(WSME)蛋白质折叠统计力学模型输出,快速生成真实结构系综的流程。 该方法依赖于将分块 WSME 模型的输出——由 0 和 1 组成的字符串,用于描述成千上万乃至数百万个微观状态中每个残基的构象状态,且每个微观状态都被赋予一个基于物理能量-熵项的统计权重,以及自由能谱——与 ATSAS 软件套件中 EOM(ensemble optimization method,系综优化方法)的 RANCH 模块相结合,从而在模型框架内提供结构系综的三维视图。该方法适用于多种单链单体系统,长度范围为 30 至 500 个残基,包括球状蛋白和重复蛋白。 所生成的结构系综还可以依据其在给定宏观状态或某一反应坐标取值范围内的自由能进行排序。由于 WSME 模型微观状态的统计权重可以通过实验进行重加权或校准,这些系综不仅有助于揭示折叠机制,还能够阐明决定功能的结构偏离,以及原本被埋藏的结合口袋的开放过程。

蛋白质的功能与其在天然系综中所采样的构象状态密切相关。因此,从单一静态结构生成系综已成为一个备受关注的研究领域。在本应用说明中,我们介绍了 Hashi,这是一条能够基于蛋白质折叠的结构基础 Wako-Saito-Munoz Eaton(WSME)统计力学模型输出,快速生成真实结构系综的流程。

该方法依赖于将块状 WSME 模型的输出——由零和一组成的字符串,用于描述在成千上万乃至数百万个微观状态中每个残基的构象状态,且每个微观状态都被赋予基于物理能量-熵项推导出的统计权重,以及自由能分布——与 ATSAS 软件套件中 EOM(系综优化方法)的 RANCH 模块相结合,从而在模型框架内提供结构系综的三维视图。该方法适用于多种长度范围为 30 至 500 个残基的单链单体系统,包括球状蛋白和重复蛋白。

所生成的结构系综还可以根据其在给定宏观状态或某一反应坐标取值范围内的自由能进行排序。由于 WSME 模型微观状态的统计权重可以通过实验进行重新加权或校准,这些系综不仅能够揭示折叠机制,还能够阐明决定功能的结构偏离,以及原本埋藏的结合口袋的开放过程。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.01.729173v1?rss=1

🏷️ 蛋白质折叠 构象系综 统计力学模型 三维结构预测 WSME模型