序列电荷排布组织内在无序蛋白的盐响应机制:一种可解释的机器学习方法

root 提交于 周五, 06/05/2026 - 14:47
本征无序蛋白(IDPs)的构象系综对离子强度表现出高度敏感的响应,而这种响应的方向和幅度在不同序列类别之间差异显著,范围可从聚电解质收缩到多两性电解质膨胀。近期提出的序列条件化模型能够在给定溶液条件下快速获得完整系综或系综平均性质,但并不能直接识别哪些低维聚合物物理描述符在组织盐响应行为中起主导作用。在本研究中,我们构建了一个包含 511 条序列的文库,其中涵盖受控的 {kappa} 变体、NCPR 序列系列、按 IDRome 分层的天然 IDR,以及低 FCR 的 IDRome 序列,并在五种单价盐浓度(50 mM 至 500 mM)下进行了 2,555 次 CALVADOS-2 模拟。对于每条序列,我们提取盐响应斜率 dRg/d[salt],并将其归入四种状态之一:聚电解质收缩、多两性电解质膨胀、非单调响应或盐不敏感行为。基于八个具有理论动机的序列描述符,我们发现由链长加权的序列电荷修饰参数 SCD x N 是组织盐响应的主导坐标,其贡献约占总 SHAP 归因的 40%,并且超过第二重要特征两倍以上。岭回归能够解释分布内的相当一部分方差(随机交叉验证下 R2 = 0.83),而梯度提升树则进一步提高了分布内性能(R2 = 0.97),并在更严格的留一子集验证测试中保持了预测能力(R2 = 0.60),这表明盐响应包含可迁移但具有非线性的、由序列编码的结构。状态分类能够稳健恢复盐响应的方向,且不存在聚电解质与多两性电解质之间的混淆;相比之下,非单调和盐不敏感序列仅凭静态序列特征仍较难区分。综上,这些结果确立了 SCD x N 作为一个紧凑且可解释的组织坐标,用于表征源自 CALVADOS-2 的 IDP 盐响应,并为系综层面的生成模型提供了聚合物物理学与特征层面的补充。

序列电荷装饰组织内在无序蛋白中的盐响应机制:一种可解释的机器学习 | bioRxiv

跳转至主要内容

首页 关于 提交 提醒 / RSS 搜索该关键词 高级搜索 新结果

序列电荷装饰组织内在无序蛋白中的盐响应机制:一种可解释的机器学习

查看 ORCID 个人主页

Mahesh Aryal

doi: https://doi.org/10.64898/2026.06.01.729380

Mahesh Aryal 北达科他州立大学

在 Google Scholar 上查找该作者 在 PubMed 上查找该作者 在持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。 本文依据 CC-BY 4.0 国际许可协议公开提供。

查看讨论主题。

返回顶部 上一篇 下一篇

发布于 2026 年 6 月 4 日。

下载 PDF 补充材料 电子邮件

您的电子邮件 * 您的姓名 * 发送至 * 输入多个地址时,请分行输入或用逗号分隔。

您将要通过电子邮件发送以下内容

序列电荷装饰组织内在无序蛋白中的盐响应机制:一种可解释的机器学习

邮件主题

(您的姓名)已从 bioRxiv 向您转发一个页面

邮件正文

(您的姓名)认为您可能希望查看 bioRxiv 网站上的此页面。

您的个人留言

验证码

此问题用于测试您是否为真人访客,并防止自动垃圾信息提交。

分享

序列电荷装饰组织内在无序蛋白中的盐响应机制:一种可解释的机器学习

Mahesh Aryal bioRxiv 2026.06.01.729380; doi: https://doi.org/10.64898/2026.06.01.729380

分享本文: 复制

引用工具

序列电荷装饰组织内在无序蛋白中的盐响应机制:一种可解释的机器学习

Mahesh Aryal bioRxiv 2026.06.01.729380; doi: https://doi.org/10.64898/2026.06.01.729380


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.01.729380v1?rss=1

🏷️ 内在无序蛋白 盐响应机制 序列电荷排布 可解释机器学习 分子模拟 聚合物物理