- 1次围观
背景:植物发育是一个由复杂蛋白质调控网络所支配的多层面过程。高通量测序方法极大地扩展了植物转录组和蛋白质组数据集,然而,植物发育蛋白的结构信息与UniProt序列条目之间仍存在巨大差距。X射线晶体学、核磁共振波谱和冷冻电镜技术的进步,使蛋白质复合物结构及其动态特征的解析成为可能。AlphaFold等人工智能驱动工具彻底革新了对蛋白质结构复杂性的分析。然而,现有的三维结构模型主要优先覆盖人类蛋白质组及其他哺乳动物,而非植物。因此,评估植物发育蛋白的结构覆盖率对于识别研究空白、指导结构—功能研究以及推动农业发展至关重要。 结果:本文聚焦于拟南芥发育相关蛋白的结构覆盖率绘制。我们观察到,与人类蛋白相比,拟南芥蛋白在蛋白质数据库(PDB)中的表征存在显著差距。我们的分析鉴定出16,389个经审阅的UniProt条目,其中仅有1,038个具有实验测定结构。利用PlantGSEA进行功能映射后,发现有3,485种蛋白与植物发育过程相关;其中仅337种(9.67%)具有实验测定结构。相比之下,对AlphaFold数据库的分析表明,在39,278个拟南芥UniProt蛋白条目中,69.85%具有预测结构。值得注意的是,来自拟南芥的全部3,485种植物发育蛋白(100%)均被AlphaFold模型覆盖。相较于人类,AlphaFold为拟南芥提供了显著更高的结构覆盖率,这突显了计算方法在应对难结晶蛋白结构研究挑战方面的优势。此外,79.15%的经审阅拟南芥蛋白模型表现出高置信度(pLDDT > 70),表明其结构预测具有较高可靠性。尽管拟南芥发育蛋白的实验结构覆盖率仍然有限,AlphaFold已显著拓展了可获取的结构图景。 结论:本研究考察了拟南芥植物发育蛋白的结构覆盖率,强调了结合实验方法与AlphaFold开展结构研究的迫切必要性。该研究为弥合植物发育分子机制认识中的知识鸿沟提供了研究方向。
背景:植物发育是一个由复杂蛋白质调控网络支配的多层面过程。高通量测序方法极大地扩展了植物转录组学和蛋白质组学数据集,然而,植物发育蛋白的结构信息与 UniProt 序列条目之间仍存在巨大差距。X 射线晶体学、核磁共振波谱学和冷冻电镜技术的进步,使蛋白质复合物结构及其动态特性的解析成为可能。AlphaFold 等人工智能驱动工具彻底革新了对蛋白质结构复杂性的分析。然而,现有的三维结构模型主要优先覆盖人类蛋白质组及其他哺乳动物,而非植物。因此,评估植物发育蛋白的结构覆盖度对于识别研究空白、指导结构—功能研究以及推动农业发展至关重要。
结果:本研究聚焦于拟南芥发育相关蛋白的结构覆盖度绘制。我们观察到,与人类蛋白相比,拟南芥蛋白在蛋白质数据库(PDB)中的结构表征存在显著不足。我们的分析鉴定出 16,389 个经审阅的 UniProt 条目,其中仅有 1,038 个具有实验测定结构。利用 PlantGSEA 进行功能映射后,发现有 3,485 个蛋白与植物发育过程相关;其中仅有 337 个(9.67%)具有实验测定结构。相比之下,对 AlphaFold 数据库的分析显示,在 39,278 个拟南芥 UniProt 蛋白条目中,69.85% 具有预测结构。值得注意的是,来自拟南芥的全部 3,485 个植物发育相关蛋白(100%)均被 AlphaFold 模型覆盖。相较于人类,AlphaFold 为拟南芥提供的显著更高的结构覆盖度,凸显了计算方法在应对难结晶蛋白结构研究挑战方面的优势。此外,79.15% 的经审阅拟南芥蛋白模型表现出高置信度(pLDDT > 70),表明其结构预测具有较高可靠性。尽管拟南芥发育蛋白的实验结构覆盖度仍然有限,AlphaFold 已显著拓展了可获取的结构空间。
结论:本研究考察了拟南芥植物发育蛋白的结构覆盖度,强调了结合实验方法与 AlphaFold 方法开展结构研究的迫切必要性。该研究为弥合植物发育分子机制认知中的知识缺口提供了研究方向。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.31.729038v1?rss=1
🏷️ 拟南芥 植物发育 蛋白质结构覆盖率 AlphaFold 结构生物学 UniProt/PDB