面向抗菌肽发现的物种与主题感知表示学习

root 提交于 周二, 06/02/2026 - 16:47
抗菌药物耐药性构成了全球卫生领域的一项重大挑战,因此亟需高效策略来发现高效的抗菌肽(AMP)。尽管近年来的生成模型能够产生大量候选序列,但由于此类测量涉及高昂成本和大量时间,在湿实验中对所有生成的肽进行实验验证并不现实。因此,人们迫切需要对肽效力进行准确预测,而该效力通常以最小抑菌浓度(MIC)来衡量。 我们提出了 STAMP,这是一个用于抗菌肽发现中物种与主题感知表征学习的框架。STAMP 将蛋白质语言模型嵌入与物种条件信息以及能够捕捉序列层面模式的主题感知表征相结合,从而能够在单一模型中实现跨多种细菌物种的可泛化预测。 我们在三个基准数据集上对 STAMP 进行了评估,这些数据集包括两个先前已发表的数据集,以及一个新整理的数据集;该新数据集来源于 DBAASP,并系统性地处理了重复项和不一致问题。STAMP 在这些数据集上取得了强劲的预测性能,Pearson 相关系数(PCC)达到 0.837,R2 达到 0.70,优于多个基线模型。 重要的是,我们进一步使用针对大肠杆菌(E. coli)和表皮葡萄球菌(S. epidermidis)进行抗菌活性实验测试的肽,对我们的预测模型进行了验证,证明了其在现实场景中的适用性。此外,残基层面的重要性分析还为决定抗菌活性的序列决定因素提供了见解。

在持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。 本文依据 CC-BY 4.0 国际许可协议开放获取。

查看讨论串。

返回顶部

上一篇

下一篇

发表于 2026 年 6 月 1 日。

下载 PDF

补充材料

电子邮件

感谢您有兴趣帮助传播 bioRxiv 的内容。

您的电子邮件 *

您的姓名 *

发送至 *

请输入多个地址,每行一个,或使用逗号分隔。

您将通过电子邮件发送以下内容

用于抗菌肽发现的物种与主题感知表征学习

邮件主题

(您的姓名)已从 bioRxiv 转发了一个页面给您

邮件正文

(您的姓名)认为您可能希望查看 bioRxiv 网站上的此页面。

您的个人留言

验证码

此问题用于测试您是否为人类访客,并防止自动垃圾信息提交。

分享

用于抗菌肽发现的物种与主题感知表征学习

Sarala Padi, Kinjal Mondal, Navleen Kaur, David P. Hoogerheide, Frank Heinrich, Ella Mihailescu, Jeffery B. Klauda, Antonio Cardone, Walid Keyrouz

bioRxiv 2026.05.28.728246; doi: https://doi.org/10.64898/2026.05.28.728246

分享本文:

复制

引文工具

用于抗菌肽发现的物种与主题感知表征学习

Sarala Padi, Kinjal Mondal, Navleen Kaur, David P. Hoogerheide, Frank Heinrich, Ella Mihailescu, Jeffery B. Klauda, Antonio Cardone, Walid Keyrouz

bioRxiv 2026.05.28.728246; doi: https://doi.org/10.64898/2026.05.28.728246


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.28.728246v1?rss=1

🏷️ 抗菌肽 最小抑菌浓度预测 蛋白质语言模型 表示学习 多物种泛化 抗菌药物耐药性