- 3 次围观
recount3 在线资源提供了来自人类和小鼠的大规模统一处理 RNA-seq 样本,数量达数万,数据来源于 Sequence Read Archive 等主要测序存储库。尽管这些数据集的访问传统上主要集中于 R/Bioconductor 生态系统,但 Python 在生物信息学和机器学习中的影响力日益提升,因此迫切需要面向 Python 用户的原生且高效的工具。因此,我们提出了 recount3 Python 软件包,其具备健壮的应用程序编程接口(API)和命令行接口(CLI),用于发现、下载并实例化 recount3 资源。该软件协调统一资源定位符(URL)解析、持久化磁盘缓存,以及将数据自动解析为可直接用于分析的数据结构,包括 Pandas DataFrame 和 BiocPy RangedSummarizedExperiment 对象。recount3 Python 软件包显著降低了在基于 Python 的计算流程中大规模利用 RNA-seq 数据的门槛,弥合了海量公共转录组数据与现代机器学习生态系统之间的鸿沟。
本网站正在使用一项安全服务来保护自身免受在线攻击。您刚刚执行的操作触发了该安全解决方案。可能触发此拦截的行为有多种,包括提交某个特定词语或短语、SQL 命令或格式错误的数据。
您可以向网站所有者发送电子邮件,告知您被拦截。请在邮件中说明当此页面出现时您正在进行的操作,并附上本页底部显示的 Cloudflare Ray ID。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.17.732943v1?rss=1
🏷️ RNA-seq 转录组数据 Python软件包 生物信息学工具 数据访问接口
来源出处
用于以编程方式访问统一处理的 RNA-seq 数据的 recount3 Python 软件包
https://www.biorxiv.org/content/10.64898/2026.06.17.732943v1?rss=1