PanKbase整合单细胞图谱:人类胰岛的综合图谱

root 提交于 周三, 06/10/2026 - 02:47
摘要 目的/假设 胰岛组织的单细胞RNA测序(scRNA-seq)是研究1型糖尿病(T1D)的有力工具。然而,单个数据集在规模上存在局限,且分散于不同供体、实验室和实验条件之中,这凸显了构建统一单细胞图谱的必要性。本研究旨在通过汇集多种来源的数据,构建一套全面整合的人类离体胰岛scRNA-seq图谱。 方法 收集了来源于离体胰岛的公开可用scRNA-seq数据集,这些数据由Human Pancreas Analysis Program(HPAP)、Prodo Labs和Integrated Islet Distribution Program(IIDP)生成和/或提供。研究实施了系统性的质量控制,以筛选高质量样本、测序读段和细胞。在数据整合过程中,纳入了年龄、性别、体重指数(BMI)、原始研究、处理条件、胰岛数据/分发资源以及测序化学体系等重要变量。 结果 我们构建了一套全面的人类胰岛单细胞图谱,包含来自140名供体的191项高质量检测(女性59名,男性81名),覆盖五类表型组:无糖尿病对照供体(69名)、无糖尿病但自身抗体阳性的供体(12名)、糖尿病前期供体(11名)、1型糖尿病供体(12名)以及2型糖尿病供体(36名)。该图谱还纳入了经过实验扰动的样本,包括暴露于SARS-CoV-2感染和促炎性细胞因子的样本。总体而言,该图谱包含448,935个细胞,涵盖了主要的内分泌胰岛细胞群,如α细胞(43.3%)和β细胞(26.8%),以及非内分泌细胞群,如内皮细胞(0.75%)和免疫细胞(0.6%)。 结论/解释 通过对多来源数据进行统一协调与整合,我们构建了一套全面的人类离体胰岛单细胞图谱,并已在 `www.pankbase.org` 公开发布。该图谱为基于假设的糖尿病病理生理机制研究提供了平台;同时,鉴于其在测序读段、条形码和样本层面实施了严格的质量控制,并辅以审慎的元数据整理,因此也非常适合用于下游机器学习应用。

摘要

目的/假设 胰岛组织的单细胞RNA测序(scRNA-seq)是研究1型糖尿病(T1D)的有力工具。然而,单个数据集在规模上有限,且分散于不同供体、实验室和实验条件之间,这凸显了构建统一单细胞图谱的必要性。本研究旨在通过汇集多种来源的数据,构建一套全面整合的人类离体胰岛scRNA-seq图谱。

方法 收集了来源于离体胰岛、由人类胰腺分析计划(HPAP)、Prodo Labs和综合胰岛分发计划(IIDP)生成和/或提供的公开scRNA-seq数据集。实施了系统性的质量控制,以筛选高质量样本、测序读段和细胞。在数据整合过程中,纳入了年龄、性别、体重指数(BMI)、来源研究、处理条件、胰岛数据/分发资源以及测序化学体系等重要变量。

结果 我们构建了一套全面的人类胰岛单细胞图谱,包含来自140名供体的191项高质量检测(59名女性,81名男性),覆盖五类表型组:无糖尿病对照供体(69名)、无糖尿病但自身抗体阳性供体(12名)、糖尿病前期供体(11名)、1型糖尿病供体(12名)以及2型糖尿病供体(36名)。该图谱还纳入了经实验扰动的样本,包括暴露于SARS-CoV-2感染和促炎性细胞因子的样本。总体而言,该图谱包含448,935个细胞,涵盖了主要的胰岛内分泌细胞群,如α细胞(43.3%)和β细胞(26.8%),以及非内分泌细胞群,如内皮细胞(0.75%)和免疫细胞(0.6%)。

结论/解释 通过对多来源数据进行统一协调与整合,我们构建了一套全面的人类离体胰岛单细胞图谱,并已在 www.pankbase.org 公开发布。该图谱为基于假设的糖尿病病理生理学研究提供了平台;同时,鉴于其在测序读段、条形码和样本层面均经过严格质量控制,并辅以细致的元数据整理,因此也非常适用于下游机器学习应用。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.02.729719v1?rss=1

🏷️ 单细胞RNA测序 胰岛图谱 糖尿病 数据整合 人类胰岛 单细胞图谱