研究动机:批次效应校正对于整合大规模转录组数据集至关重要,例如单细胞 RNA-seq 或多研究 bulk RNA-seq 数据集,其目的是降低可能掩盖生物学信号的技术噪声。现有校正方法要么无法输出计数数据,而计数数据对于差异表达分析等最先进的下游分析至关重要;要么在欠定的研究设计下无法收敛。 研究结果:我们提出了 reComBat-seq,这是一种通过引入 Elastic Net 正则化来扩展 ComBat-seq 负二项回归框架的方法。该方法在保留计数数据整数性质的同时,也解决了设计矩阵秩亏的问题。在模拟数据集和真实数据集(如单细胞 RNA-seq 数据)上的基准测试表明,reComBat-seq 能够在复杂研究设计中成功去除批次效应,同时保持与下游差异表达分析工具的兼容性。 可获得性与实现:reComBat-seq 的源代码可见于 https://github.com/menchelab/reComBat-seq。用于复现本文所示分析的全部代码可见于 https://github.com/menchelab/reComBatseq_Studies。本研究产生的数据可从 https://doi.org/10.5281/zenodo.19736515 获取。所使用的单细胞 RNA-seq 数据可见于 https://doi.org/10.5281/zenodo.14234956。
reComBat-seq:用于欠定转录组数据集中批次效应校正的正则化负二项回归 | bioRxiv
跳转至主要内容
首页 关于 提交 提醒 / RSS 搜索此关键词 高级搜索 最新结果
reComBat-seq:用于欠定转录组数据集中批次效应校正的正则化负二项回归
Zhasmina Stoyanova, 查看 ORCID 个人资料 Daniel Malzl, 查看 ORCID 个人资料 Joerg Menche
doi: https://doi.org/10.64898/2026.05.27.728166
Zhasmina Stoyanova 路德维希·玻尔兹曼网络医学研究所 在 Google Scholar 上查找该作者 在 PubMed 上查找该作者 在持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。 本文依据 CC-BY-NC-ND 4.0 国际许可协议 进行发布。
查看讨论串。 返回顶部 上一页 下一页 发布于 2026 年 5 月 30 日。 下载 PDF 补充材料 数据/代码 电子邮件
感谢您有兴趣帮助传播 bioRxiv。 您的电子邮件 *
您的姓名 *
发送至 *
请输入多个地址,每行一个,或用逗号分隔。
您将要发送以下内容的电子邮件 reComBat-seq:用于欠定转录组数据集中批次效应校正的正则化负二项回归
邮件主题 (您的姓名)已从 bioRxiv 转发一个页面给您
邮件正文 (您的姓名)认为您可能希望查看 bioRxiv 网站上的此页面。
您的个人留言
验证码 此问题用于测试您是否为人工访问者,并防止自动垃圾信息提交。
分享 reComBat-seq:用于欠定转录组数据集中批次效应校正的正则化负二项回归
Zhasmina Stoyanova , Daniel Malzl , Joerg Menche
bioRxiv 2026.05.27.728166; doi: https://doi.org/10.64898/2026.05.27.728166
分享本文: 复制 引文工具
reComBat-seq:用于欠定转录组数据集中批次效应校正的正则化负二项回归
Zhasmina Stoyanova , Daniel Malzl , Joerg Menche
bioRxiv 2026.05.27.728166; doi: https://doi.org/10.64898/2026.05.27.728166
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.05.27.728166v1?rss=1
🏷️ 批次效应校正 转录组学 RNA-seq 负二项回归 弹性网络正则化 差异表达分析
来源出处
reComBat-seq:用于欠定转录组数据集中批次效应校正的正则化负二项回归
https://www.biorxiv.org/content/10.64898/2026.05.27.728166v1?rss=1