- 1次围观
宿主嗜性和组织嗜性等病毒表型是决定病毒感染与传播的关键因素。与细胞生物相比,病毒表型的推断面临独特挑战,因为病毒的复制与存活完全依赖宿主机制。当前预测病毒表型的方法主要依赖病毒基因组数据,往往忽视与宿主相关的信息。在此,我们评估了利用预测的病毒-人蛋白质相互作用(protein-protein interactions, PPIs)并结合机器学习算法推断多种病毒表型的效用。 在预测人类感染性方面,基于PPI的机器学习模型优于基于病毒基因组和蛋白质序列的模型,后者使用了大语言模型嵌入。该模型也优于既往整合病毒和宿主基因组数据的方法。模型识别出的人类蛋白显著富集于与病毒感染和免疫反应相关的功能。 在预测人类RNA病毒的多种表型时,基于PPI的模型在预测毒力、人际传播性和传播途径方面表现优于基于病毒序列的模型,而在预测组织嗜性方面则与基于基因组序列的模型表现相当。 最后,我们证明了基于PPI的模型能够区分高风险与低风险HPV基因型。与高风险HPV相关的蛋白参与细胞凋亡和免疫调控,而与低风险HPV相关的蛋白则富集于端粒维持和DNA修复。总体而言,本研究首次证明了预测的病毒-人PPIs在推断病毒表型中的价值,从而加深了我们对这些表型背后分子机制的理解。该研究还为新兴病毒的风险评估提供了有效工具,有助于提升大流行防范能力。
病毒表型,如宿主嗜性和组织嗜性,是决定病毒感染和传播的关键因素。与细胞生物相比,病毒表型的推断面临独特挑战,因为病毒的复制与生存完全依赖宿主机制。当前用于预测病毒表型的方法主要依赖病毒基因组数据,往往忽视与宿主相关的信息。在此,我们评估了预测的病毒-人蛋白质相互作用(PPI)在利用机器学习算法推断多种病毒表型中的效用。
在预测人类感染性方面,基于PPI的机器学习模型优于同时使用大语言模型嵌入的病毒基因组和蛋白质序列模型。该模型也超过了以往结合病毒和宿主基因组数据的方法。模型识别出的人类蛋白显著富集于与病毒感染和免疫应答相关的功能。
在预测人类RNA病毒的多种表型时,基于PPI的模型在预测毒力、人际传播能力和传播途径方面优于基于病毒序列的模型,而在预测组织嗜性方面表现与基于基因组序列的模型相当。最后,我们证明了基于PPI的模型能够区分高风险与低风险的人乳头瘤病毒(HPV)基因型。与高风险HPV相关的蛋白参与细胞凋亡和免疫调控,而与低风险HPV相关的蛋白则富集于端粒维持和DNA修复。
总体而言,本研究首次证明了预测的病毒-人PPI在推断病毒表型中的价值,从而加深了我们对这些表型所依赖的分子机制的理解。该研究还为新发病毒的风险评估提供了有效工具,有助于提升大流行防范能力。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.12.732009v1?rss=1
🏷️ 病毒-宿主互作 蛋白质相互作用 病毒表型预测 机器学习 组织嗜性 风险评估
来源出处
病毒-人类蛋白质相互作用可预测病毒表型
https://www.biorxiv.org/content/10.64898/2026.06.12.732009v1?rss=1