咖啡豆象(Araecerus fasciculatus)基因组揭示细胞色素P450库是昆虫来源咖啡因解毒的一种趋同候选机制

root 提交于 周二, 06/16/2026 - 20:47
咖啡豆象,Araecerus fasciculatus(鞘翅目,象甲总科,长喙甲科),是一种世界性分布的害虫,可危害100多种贮藏农产品,尤其对咖啡(Coffea arabica)造成显著经济影响。尽管长喙甲科已有两个染色体水平基因组作为“生命达尔文树”(Darwin Tree of Life, DToL)项目的一部分于近期发布(Booth et al. 2024;Crowley et al. 2025),但该科此前尚无经过功能注释的基因组可用。在此,我们报告了A. fasciculatus的一个基因组草图组装,该组装基于PacBio HiFi长读长数据构建,并通过三级宏基因组过滤流程去除宿主植物(C. arabica)及微生物污染。最终组装结果总长475 Mb,包含3,617个scaffold(N50 = 170 kb),BUSCO完整性为88.5%(insecta_odb10),重复率仅为3.1%。利用BRAKER2进行基因预测共鉴定出22,384个蛋白编码基因,其中11,783个通过与SwissProt的相似性比对获得了功能注释。值得注意的是,我们鉴定出92个细胞色素P450(CYP)基因,其中包括位于两个scaffold上的串联基因簇(ptg000464l上4个基因,ptg001867l上5个基因),提示该谱系可能通过串联重复发生了特异性扩张。针对黑腹果蝇(Drosophila melanogaster)中参与咖啡因代谢的P450基因(CYP12D1、CYP6d5、CYP6a8)进行同源性检索,获得了显著匹配结果(e值为9.7e10-110至5.4e10-101,序列一致性为33–38%)。与此形成鲜明对比的是,针对细菌咖啡因N-去甲基化酶基因(ndmA/B/C/D)的全面BLAST检索——这些基因在咖啡果小蠹Hypothenemus hampei(小蠹亚科)中通过水平基因转移介导咖啡因降解——在A. fasciculatus基因组、预测蛋白质组及其相关细菌scaffold中均未检出任何命中。对4个最优Araecerus P450候选基因进行AlphaFold2结构预测,得到高置信度模型(pLDDT 84.5–93.9,pTM 0.735–0.930),且均保留了P450保守催化基序。Foldseek结构同源性检索进一步证实,这4个候选蛋白均采取细胞色素P450折叠(最高命中:人类CYP3A4、CYP3A7、CYP11A1;TM-score 0.90–0.92;概率1.000),而与细菌Rieske折叠酶无任何命中。以咖啡因为配体对这些结构进行分子对接,Araecerus候选蛋白的结合亲和力为-5.41至-5.80 kcal/mol,与实验验证的黑腹果蝇CYP6a8所得的-5.55 kcal/mol相当或更强,并且显著强于作为细菌NdmA结构外群的-3.70 kcal/mol(PDB: 6ICP)。系统发育分析表明,这4个候选基因在两种不取食种子的DToL长喙甲科昆虫(Pseudeuparius sepicola和Platystomos albinus)中均具有明确的直系同源基因,说明这些P450基因早于向含咖啡因种子取食的食性转变而出现。Araecerus候选基因主要归属于CYP6家族(第3类群),而黑腹果蝇中主要的咖啡因代谢P450——CYP12D1——则属于线粒体类群,这证实了不同P450亚家族在咖啡因代谢中被趋同招募。上述结果支持这样一种假说:A. fasciculatus采用的是由昆虫自身编码、以P450介导的咖啡因解毒途径,这一路径与小蠹亚科中已有报道的细菌水平基因转移机制在本质上不同。这表明,在象甲总科内部,咖啡因抗性通过相互独立的分子策略发生了趋同进化,并为长喙甲科的比较研究提供了首个经过功能注释的基因组资源。

咖啡豆象,Araecerus fasciculatus(鞘翅目,象甲总科,长吻象甲科),是一种世界性分布的害虫,可危害100余种贮藏农产品,并对咖啡(Coffea arabica)造成尤为显著的经济影响。尽管作为“生命达尔文树”(Darwin Tree of Life, DToL)项目的一部分,近期已发布了两个长吻象甲科染色体水平基因组(Booth et al. 2024;Crowley et al. 2025),但该科此前尚无具备功能注释的基因组可用。在此,我们报告了A. fasciculatus的一个基因组草图组装,该组装基于PacBio HiFi长读长数据构建,并通过三级宏基因组过滤流程去除寄主植物(C. arabica)及微生物污染。最终组装大小为475 Mb,包含3,617个scaffold(N50 = 170 kb),BUSCO完整度为88.5%(insecta_odb10),重复率仅为3.1%。利用BRAKER2进行基因预测,共鉴定出22,384个蛋白编码基因,其中11,783个通过与SwissProt的相似性比对获得了功能注释。

值得注意的是,我们鉴定出92个细胞色素P450(CYP)基因,其中在两个scaffold上存在串联基因簇(ptg000464l上4个基因,ptg001867l上5个基因),提示这些基因可能通过串联重复发生谱系特异性扩张。针对黑腹果蝇(Drosophila melanogaster)咖啡因代谢相关P450基因(CYP12D1、CYP6d5、CYP6a8)的同源性搜索获得了显著匹配(e值为9.7e10-110至5.4e10-101,序列一致性为33–38%)。与之形成鲜明对比的是,对细菌咖啡因N-去甲基化酶基因(ndmA/B/C/D)的全面BLAST搜索——这些基因在咖啡果小蠹Hypothenemus hampei(小蠹亚科)中通过水平基因转移介导咖啡因降解——在A. fasciculatus基因组、预测蛋白组及其相关细菌scaffold中均未检出任何命中。对4个Araecerus中排名靠前的P450候选基因进行AlphaFold2结构预测,获得了高置信度模型(pLDDT 84.5–93.9,pTM 0.735–0.930),并显示出保守的P450催化基序。Foldseek结构同源性搜索进一步证实,这4个候选蛋白均采取细胞色素P450折叠(最佳命中:人类CYP3A4、CYP3A7、CYP11A1;TM-score为0.90–0.92;概率为1.000),且未发现任何细菌Rieske折叠酶的命中。将咖啡因与这些结构进行分子对接后,Araecerus候选蛋白的结合亲和力为-5.41至-5.80 kcal/mol,与实验验证的黑腹果蝇CYP6a8所得的-5.55 kcal/mol相当或更高,并显著强于作为细菌NdmA结构外群的-3.70 kcal/mol(PDB: 6ICP)。

系统发育分析显示,这4个候选基因在两种不取食种子的DToL长吻象甲科昆虫(Pseudeuparius sepicola和Platystomos albinus)中均具有明确的直系同源物,这表明这些P450基因早于向含咖啡因种子取食的食性转变而存在。Araecerus候选基因主要归属于CYP6家族(第3类群),而黑腹果蝇中主要的咖啡因代谢P450——CYP12D1——则属于线粒体类群,这证实了不同P450亚家族在咖啡因代谢中的趋同招募。上述结果支持以下假说:A. fasciculatus采用的是一种由昆虫自身编码、以P450介导的咖啡因解毒途径,其机制与小蠹亚科中记录的细菌水平基因转移机制在本质上不同。这代表了象甲总科内部通过独立分子策略实现咖啡因抗性的趋同进化,并为长吻象甲科的比较研究提供了首个具备功能注释的基因组资源。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.11.731724v1?rss=1

🏷️ 基因组组装 功能注释 细胞色素P450 咖啡因解毒 趋同进化 害虫基因组