东北林蛙染色体水平基因组组装

root 提交于 周二, 06/16/2026 - 12:47
东北林蛙(Rana dybowskii)分布于东北亚地区,是一种具有重要价值的药用资源。目前,尚未报道其高质量基因组组装。该物种具有2n=24条染色体,但在既往研究中其基因组大小估计为3.5~4.6 Gb。其染色体尺寸相对较大,达到数百兆碱基以上,这可能导致获得完整染色体水平基因组的难度增加。 在本研究中,我们通过整合PacBio HiFi长读长测序用于从头组装,以及CiFi(3C结合HiFi测序)用于scaffold构建,建立了东北林蛙的染色体水平基因组组装。最终组装结果包含12条染色体,总长度为3.95 Gb,scaffold N50长度为455 Mb。采用tetrapoda_odb12数据库进行BUSCO评估,结果显示94.2%的直系同源基因为完整,0.5%为片段化,表明该组装具有较高的完整性。 基因组注释结果显示,重复序列占组装序列的53%以上,其中反转座元件和DNA转座子分别占22%和25%。在来自4种组织(肌肉、眼、睾丸和皮肤)的RNA-seq读段辅助下,共预测到43,999个蛋白质编码基因。该高质量染色体水平参考基因组为推进该物种的遗传学研究提供了宝贵的基因组资源。

东北林蛙(Rana dybowskii)分布于东北亚地区,是一种重要的药用资源。迄今尚未报道其高质量基因组组装结果。该物种具有2n=24条染色体,但先前研究估计其基因组大小高达3.5~4.6 Gb。其染色体尺寸相对较大,超过数百兆碱基,这可能导致获得完整染色体水平基因组存在困难。

在本研究中,我们整合PacBio HiFi长读长测序用于从头组装,并结合CiFi(3C耦合HiFi测序)进行挂载,构建了东北林蛙的染色体水平基因组组装。最终组装结果包含12条染色体,总长度为3.95 Gb,scaffold N50长度为455 Mb。采用tetrapoda_odb12数据库进行BUSCO评估,结果显示94.2%的直系同源基因完整、0.5%为片段化,表明该组装具有较高的完整性。

基因组注释结果表明,重复序列占组装序列的53%以上,其中反转座元件和DNA转座子分别占22%和25%。在来自4种组织(肌肉、眼、睾丸和皮肤)的RNA-seq reads辅助下,共预测到43,999个蛋白质编码基因。该高质量染色体水平参考基因组为推进该物种的遗传学研究提供了宝贵的基因组资源。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.11.731602v1?rss=1

🏷️ 染色体水平组装 东北林蛙 基因组注释 PacBio HiFi测序 两栖动物基因组