- 2 次围观
蛋白质动力学本质上是一个轨迹预测问题,但分子动力学(MD)模拟仍然代价高昂,而静态结构预测器并不对按时间排序的运动进行建模。我们提出了 VelocityFM,这是一种短时域蛋白质轨迹预测器,它在残基框架与扭转角上于速度空间中应用校正流匹配。 该模型结合了六个不变点注意力(IPA)模块与一个两层的逐残基时间自注意力编码器,并在 710 个 ATLAS 蛋白质所包含的 2090 条经过筛选的重复轨迹上进行训练。在主要的 128 帧滚动预测时域上,VelocityFM 在 72 个留出蛋白质上取得了 0.929 的 TM-score 中位数,其中 100% 的蛋白质保持在 TM>0.7 以上,并实现了 100% 无空间冲突生成。主链几何结构同样保持稳健,Ramachandran 优选率中位数达到 91.09%,而动力学校准则较为保守,RMSF 比值中位数为 0.697。 这些结果表明,速度空间中的几何学习能够将短时域轨迹预测泛化到未见过的蛋白质,同时在其预期操作范围内保持折叠结构与几何有效性。
蛋白质动力学从根本上说是一个轨迹预测问题,但分子动力学(MD)模拟仍然代价高昂,而静态结构预测器并不能对具有时间顺序的运动进行建模。我们提出了 VelocityFM,这是一种短时域蛋白质轨迹预测器,在残基框架与扭转角上于速度空间中应用校正流匹配(rectified flow matching)。该模型结合了六个不变点注意力(Invariant Point Attention, IPA)模块与一个两层的逐残基时间自注意力编码器,并在包含 710 个 ATLAS 蛋白质、由 2090 条经筛选重复轨迹构成的数据集上进行训练。
在主要的 128 帧滚动预测时域上,VelocityFM 在 72 个留出蛋白质上取得了 0.929 的 TM-score 中位数,其中 100% 的蛋白质保持在 TM > 0.7 以上,且生成结果 100% 无空间冲突。主链几何性质同样表现稳健,Ramachandran 优选区占比中位数达到 91.09%,而动力学校准则较为保守,RMSF 比值中位数为 0.697。这些结果表明,速度空间中的几何学习能够在其预期适用范围内,将短时域轨迹预测泛化到未见过的蛋白质,同时保持折叠结构与几何有效性。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.05.730410v1?rss=1
🏷️ 蛋白质动力学 轨迹预测 流匹配 分子动力学模拟 蛋白质结构建模 几何学习
来源出处
VelocityFM:通过速度空间中的流匹配进行短时域蛋白质轨迹预测
https://www.biorxiv.org/content/10.64898/2026.06.05.730410v1?rss=1