- 2 次围观
LINE-1逆转座子是人类基因组中目前仍然活跃的唯一自主移动元件,并且仍然是突变、基因组重塑和疾病风险的重要来源。然而,年轻的、全长的、潜在活性的拷贝(即最有可能塑造当代基因组的元件)由于长度较长、重复性高且难以通过短读长测序清晰解析,长期以来基本无法进行群体尺度分析。在本研究中,我们利用人类泛基因组参考联盟的47个定相长读长组装结果(代表94条单倍型),构建了近期人类LINE-1演化的等位基因分辨图谱。我们在683个独特插入位点上鉴定出13,617个同时具有完整ORF1和ORF2的LINE-1等位基因,揭示每个基因组都携带一套独特的潜在活性源元件库。这些完整LINE-1谱系重现了广泛的人类群体结构,同时揭示出一个庞大、稀有且在特定群体中富集的移动元件多样性储备,而这部分多样性会被单一参考基因组方法所遗漏。我们还解析了11号染色体上一个结构可变的LINE-1阵列,表明局部复制和重排能够在不依赖经典逆转座机制的情况下扩增LINE-1序列。通过比较全长LINE-1序列,我们界定了可将古老残余序列与近期扩张谱系区分开的活性特征,并发现了一些其活性不能完全由经典亚家族标签解释的年轻LINE-1群体。序列网络分析进一步揭示了谱系更替的动态历史,其中成功的源元件兴起、播散出新的插入,并被带有特定核苷酸变化的后代所取代。综合来看,这些数据将人类LINE-1从重复序列背景转变为一个可解析的演化系统,将插入多态性、编码潜能、群体历史和近期逆转座子适应联系起来。我们的研究结果确立了人类泛基因组作为发现活性源元件以及检验移动DNA如何持续塑造基因组演化、宿主防御和疾病风险的框架。
注意:要求提供您的电子邮箱地址仅用于将您识别为本文的发送者。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.14.725010v1?rss=1
🏷️ LINE-1逆转座子 泛基因组 长读长组装 结构变异 群体遗传多样性 转座子活性