长读长单细胞基因组学:解析多重置换扩增中的嵌合体

root 提交于 周二, 06/16/2026 - 18:47
多重置换扩增(MDA)能够实现从单个细胞进行全基因组扩增,但会引入嵌合伪影,严重影响下游分析,尤其是在长读长测序中。在本研究中,我们以模式绿藻莱茵衣藻(Chlamydomonas reinhardtii)为对象,系统评估了对单细胞MDA扩增DNA进行长读长PacBio HiFi测序的效果。我们表明,MDA衍生的文库表现出高度不均一的覆盖度和极高的嵌合率,影响多达70%的读段;当使用为群体测序设计的算法进行组装时,这会导致数千个伪结构变异和错误组装。 为克服这些挑战,我们开发了lrSAGA(long-read Single Amplified Genome Assembly,长读长单细胞扩增基因组组装),一种用于组装长读长MDA测序数据集的新工具。与常规组装算法相比,使用lrSAGA生成的组装结果更完整、连续性更高,且错误组装减少了75–95%。尽管整体连续性受到MDA覆盖缺失的限制,我们证明,仅从单个单倍体细胞出发,便可准确组装莱茵衣藻基因组中高达68%的序列。 我们还利用已发表的来自单条或半条秀丽隐杆线虫(Caenorhabditis elegans)的Oxford Nanopore和PacBio HiFi数据对lrSAGA进行了进一步验证,获得了准确且高度完整的组装结果。将我们的方法应用于从环境水样中分离的单个原生生物细胞时,我们对4种未培养微生物真核生物进行了PacBio HiFi单细胞基因组测序:Naegleria属的一种变形鞭毛虫、Bodo属的一种鞭毛虫,以及来自神秘CRuMs超类群的两种深分支鞭毛虫——Collodictyon triciliatum和Diphylleia rotans。我们从单个细胞中获得了高质量的基因组草图组装,其完整度估计为70–84%,展示了长读长单细胞基因组学在揭示未培养微生物真核生物基因组多样性方面的潜力。

David Swarbreck 的 ORCID 记录

摘要

信息/历史

指标

补充材料

预览 PDF

摘要

多重置换扩增(MDA)能够实现来自单个细胞的全基因组扩增,但会引入嵌合伪影,严重影响下游分析,尤其是在长读长测序中。在此,我们以模式绿藻莱茵衣藻(Chlamydomonas reinhardtii)为对象,系统评估了对单细胞 MDA 扩增 DNA 进行 PacBio HiFi 长读长测序的表现。我们表明,源自 MDA 的文库表现出高度不均一的覆盖度以及极高的嵌合率,可影响多达 70% 的 reads;当使用为群体测序设计的算法进行组装时,这会导致数千个伪结构变异和错误组装。为克服这些挑战,我们开发了 lrSAGA(long-read Single Amplified Genome Assembly,长读长单细胞扩增基因组组装),这是一种用于组装长读长 MDA 测序数据集的新工具。与传统组装算法相比,使用 lrSAGA 生成的组装结果更完整、连续性更高,且错误组装减少了 75–95%。尽管总体连续性受限于 MDA 覆盖缺失,我们证明仅凭一个单倍体细胞,最多即可准确组装 C. reinhardtii 基因组的 68%。我们还利用已发表的来自单条或半条秀丽隐杆线虫(Caenorhabditis elegans)的 Oxford Nanopore 和 PacBio HiFi 数据对 lrSAGA 进行了进一步验证,生成了准确且高度完整的组装结果。将我们的方法应用于从环境水样中分离的单个原生生物细胞时,我们对四种未培养的微生物真核生物进行了 PacBio HiFi 单细胞基因组测序:Naegleria 属的一种变形鞭毛虫、Bodo 属的一种鞭毛虫,以及来自神秘 CRuMs 超类群的两种深分支鞭毛虫——Collodictyon triciliatum 和 Diphylleia rotans。基于单个细胞,我们生成了高质量的基因组草图组装,估计完整度为 70–84%,这表明长读长单细胞基因组学有潜力揭示未培养微生物真核生物的基因组多样性。

利益冲突声明

已声明的资助信息

Wellcome Trust ,226458 ,218328

Biotechnology and Biological Sciences Research Council ,BB/CCG1720/1 ,BB/CCG2220/1 ,BBX011089/1 ,BBS/E/ER/230002A ,BBS/E/ER/230002B ,BBS/E/T/000PR9816

Royal Society ,URF/R/191005

版权

持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。

本作品依据 CC-BY 4.0 International 许可协议提供。

返回顶部

上一项

下一项

发布于 2026 年 6 月 15 日。

下载 PDF

补充材料

电子邮件

感谢您有意帮助传播 bioRxiv 的内容。

您的电子邮件

*

您的姓名

*

发送至

*

请输入多个地址,每行一个,或以逗号分隔。

您将要发送电子邮件的内容如下

长读长单细胞基因组学:解析多重置换扩增中的嵌合体

邮件主题

(您的姓名)已从 bioRxiv 向您转发了一个页面

邮件正文

(您的姓名)认为您可能希望查看 bioRxiv 网站上的这个页面。

您的个人留言

验证码

此问题用于测试您是否为人工访问者,并防止自动化垃圾信息提交。

分享

长读长单细胞基因组学:解析多重置换扩增中的嵌合体

Jamie McGowan ,

James Lipscombe ,

Estelle S. Kilias ,

Tom Barker ,

Leah Catchpole ,

Alex Durrant ,

Naomi Irish ,

Seanna McTaggart ,

Sally D. Warring ,

Karim Gharbi ,

Thomas A. Richards ,

Neil Hall ,

David Swarbreck

bioRxiv

2026.06.11.730069;

doi:

https://doi.org/10.64898/2026.06.11.730069

分享本文:

复制

引文工具

长读长单细胞基因组学:解析多重置换扩增中的嵌合体

Jamie McGowan ,

James Lipscombe ,

Estelle S. Kilias ,

Tom Barker ,

Leah Catchpole ,

Alex Durrant ,

Naomi Irish ,

Seanna McTaggart ,

Sally D. Warring ,

Karim Gharbi ,

Thomas A. Richards ,

Neil Hall ,

David Swarbreck

bioRxiv

2026.06.11.730069;

doi:

https://doi.org/10.64898/2026.06.11.730069


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.11.730069v1?rss=1

🏷️ 单细胞基因组学 多重置换扩增 长读长测序 嵌合体伪影 基因组组装