DanioDecima:斑马鱼胚胎发生的 DNA 序列到功能模型

root 提交于 周一, 06/01/2026 - 04:47
深度学习的 DNA 序列到功能模型有望为基因组调控机制提供深入见解,然而,其性能往往受限于目标物种中数据的稀缺性。我们提出了 DanioDecima,这是一种斑马鱼特异性模型,利用从人类和小鼠训练模型中进行的迁移学习,以预测斑马鱼胚胎发育过程中组织和细胞类型特异性的基因表达。 使用预训练的人类和小鼠 Borzoi 与 Decima 权重对 DanioDecima 进行初始化,可显著提升跨细胞类型的 pseudobulk Pearson r 中位数,并改善测试集基因在基因层面的相关性。由 DanioDecima 评分引导的计算机模拟定向进化循环生成了合成启动子,其基序结构按预期的目标谱系聚类。这些发现展示了一种适用于序列到功能模型的跨物种迁移学习方法,并确立了 DanioDecima 作为斑马鱼调控工程实用资源的地位。

深度学习的 DNA 序列到功能模型有望为基因组调控提供机制性洞见,然而,其性能往往受到目标物种数据稀缺的限制。我们提出了 DanioDecima,这是一种斑马鱼特异性模型,通过利用在人类和小鼠上训练的模型进行迁移学习,来预测斑马鱼胚胎发生过程中组织和细胞类型特异性的基因表达。以预训练的人类和小鼠 Borzoi 与 Decima 权重初始化 DanioDecima,可显著提高跨细胞类型的 pseudobulk Pearson r 中位数,并改善测试集基因在基因层面的相关性。由 DanioDecima 评分引导的计算机模拟定向进化循环生成了合成启动子,其基序结构按预期的目标谱系呈聚类分布。这些发现展示了一种适用于序列到功能模型的跨物种迁移学习方法学,并使 DanioDecima 成为斑马鱼调控工程中的一项实用资源。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.29.728876v1?rss=1

🏷️ 斑马鱼胚胎发育 序列到功能模型 迁移学习 基因表达预测 合成启动子 基因组调控