鉴定原肠胚样体中细胞类型特异性调控因子的跨谱系依赖性

root 提交于 周一, 06/01/2026 - 10:47

基因在空间和时间上的正确表达水平对于正常发育至关重要。基因组学的进展使得推断发育过程中处于活跃状态的基因调控程序成为可能。然而,这种方法无法捕捉胚胎发生过程中发生的复杂多细胞相互作用。与果蝇和斑马鱼等模式生物相比,哺乳动物胚胎的生长

胚胎样体(gastruloids)是具有自组织能力、基于干细胞构建的合成胚胎,能够以可重复的方式重现后枕部胚胎发育早期阶段的关键特征。胚胎样体通过聚集300个小鼠胚胎干细胞(mESCs)48小时生成,随后给予Wnt通路激动剂Chiron 24小时脉冲处理

转录因子(TFs)是DNA结合蛋白,但在细胞核环境中,核小体可构成TF与基因调控元件结合的屏障。因此,这些区域在染色质中的物理可及性可作为一种调控机制

为了捕捉发育中胚胎样体内的基因调控复杂性,我们采用了时间序列单细胞组合索引ATAC-seq(sciATAC-seq)

为了界定引导胚胎样体发育的基因调控图谱,我们检测了改良版本的sciATAC-seq

胚胎样体发育的染色质可及性图谱。A)培养方案进行至72、96和120小时时典型胚胎样体的明场显微图像。120小时的躯干样结构(TLS)是在96小时起于5% Matrigel中培养胚胎样体后获得的。比例尺:200 µm。B)用于sciATAC-seq的培养流程及样本采集策略示意图。C)单细胞可及性数据经UMAP降维后的结果,按采集时间点着色(左)或按Leiden聚类后着色(右)。各簇按推断的细胞类型标注。Prog:祖细胞;NMP:神经中胚层祖细胞;SC:脊髓;Endo:内胚层;SMD:体节中胚层;PxMD:旁轴中胚层;PhMD:咽中胚层;Enth:内皮。D)Irx3基因附近的示例基因组区域,上方显示按簇汇总的伪总体覆盖度,下方显示单细胞覆盖度。箭头指示了一个在NMP和SC簇中特异性可及的区域。E)马赛克图显示了采集时间点与细胞簇组合中与细胞数成比例的面积。F)Upset图展示了每个细胞簇特有标记峰的数量及细胞簇之间常见组合的数量。“Other”类别表示所有出现频率过低、未被纳入展示的标记峰总和。

胚胎样体的可及性反映了多种胚胎组织中的可及性。A)胚胎来源合并单细胞可及性数据经UMAP降维后的结果

我们的时间分辨sciATAC-seq数据集使我们能够确定胚胎样体发育所依赖的调控级联。为此,我们进行了拟时序分析,该分析沿推定的分化轨迹进程对细胞进行排序

在胃样体发育过程中,CDX2 和 MSGN1 基序呈现瞬时富集。A)UMAP 图中显示的拟时序,并用箭头标示所提出的分化分支。B)UMAP 图显示了细胞水平的转录因子结合位点基序富集情况,包括 OCT4::SOX2 复合基序、CDX2 和 MSGN1,同时以 logo 形式展示其位置权重矩阵。C)热图显示了沿所提出的分化分支排序的细胞中的基序富集:(I)NMP–脊髓分化分支(左)以及(II–III)体节性–旁轴/咽部中胚层分支(右)。每个单元表示 10 个细胞分箱后的平均值。基序 Z 分数经过 GC 偏倚校正,用于描述相对于群体平均水平,在检测到相关基序的位点处可及性增加或降低的程度。

胃样体发育过程中调控图谱的变化主要由转录因子驱动。为了鉴定与细胞类型特异性调控元件结合的关键驱动转录因子,我们对差异可及性峰(DA peaks)进行了 DNA 结合基序富集分析。我们发现,在祖细胞簇中,调控元件富集了与多能性相关的 OCT4::SOX2 基序,该基序可被 OCT4 和 SOX2 结合,同时还富集了 Wnt 效应转录因子 TCF3 的结合位点。

在 NMP–脊髓分化轨迹上,我们观察到随着祖细胞向 NMP 状态转变,OCT4::SOX2 和 TCF3 基序的富集程度下降(

这表明这些细胞已经为向 NMP–脊髓分化轨迹分化做好了预置准备。我们发现,当 NMP 进一步分化为脊髓细胞时,CDX2 基序富集水平再次下降(

接下来,我们分析了体节中胚层–旁轴中胚层分化轨迹中的转录因子基序。与 NMP–脊髓轨迹类似,我们观察到在从祖细胞向体节中胚层转变时,OCT4::SOX2 和 TCF3 基序富集急剧下降,同时获得了 MSGN1(Mesogenin1)结合基序的富集,

鉴于在 NMP–脊髓分支中观察到富集 CDX 基序的开放染色质区域呈现瞬时增加,我们希望检验 CDX1、2、4 在胃样体发育过程中脊髓细胞形成中的功能必需性。为此,我们尝试利用 ΔCDX1,2,4(ΔCDX)HM1 mESCs 生成胃样体。

CDX和MSGN1缺失对类原肠胚细胞类型组成的影响。A)120小时WT和ΔCDX类原肠胚的明场显微镜图像。比例尺:200 µm。B)WT和ΔCDX类原肠胚轴比的定量分析(n = 3个生物学重复;重复1 = 圆形,WT:10个类原肠胚,ΔCDX:8个类原肠胚;重复2 = 方形,WT:10个类原肠胚,ΔCDX:10个类原肠胚;重复3 = 菱形,WT:10个类原肠胚,ΔCDX:12个类原肠胚)。C)120小时WT和ΔCDX类原肠胚的共聚焦免疫荧光(IF)图像,染色标记为FOXC1中胚层标志物(洋红色)和SOX2脊髓标志物(绿色)。DAPI为蓝色。比例尺:200 µm。D)120小时WT和ΔCDX类原肠胚中FOXC1和SOX2表达的定量分析(n = 2个生物学重复;重复1 = 圆形,WT:5个类原肠胚,ΔCDX:5个类原肠胚;重复2 = 方形,WT:5个类原肠胚,ΔCDX:5个类原肠胚)。E)UMAP图,突出显示120小时WT类原肠胚中的细胞,相对于时间序列实验中获得并以柔和颜色显示的细胞。F)与E相同,但为ΔCDX类原肠胚。G)120小时WT和ΔMSGN1类原肠胚的明场显微镜图像。比例尺:200 µm。H)WT和ΔMSGN1类原肠胚形态的定量分析(n = 3个生物学重复;重复1:WT:10个类原肠胚,ΔMSGN1:10个类原肠胚;重复2:WT:20个类原肠胚,ΔMSGN1:20个类原肠胚;重复3:WT:20个类原肠胚,ΔMSGN1:20个类原肠胚)。I)与C类似,但为120小时WT和ΔMSGN1类原肠胚。J)120小时WT和ΔMSGN1类原肠胚中FOXC1和SOX2表达的定量分析(n = 2个生物学重复;重复1 = 圆形,WT:7个类原肠胚,ΔMSGN1:6个类原肠胚;重复2 = 方形,WT:5个类原肠胚,ΔMSGN1:6个类原肠胚)。K)与E和F相同,但为ΔMSGN1类原肠胚。L)120小时WT、ΔCDX和ΔMSGN1类原肠胚中各细胞群体比例的定量分析。M)WT、ΔCDX和ΔMSGN1类原肠胚中所测定分化轨迹的示意总结。

尽管免疫荧光分析有助于测量标志基因的空间分布,但它无法确定ΔCDX类原肠胚中调控亚型的组成。因此,我们在120小时对WT类原肠胚和ΔCDX类原肠胚进行了sciATACseq。WT HM1类原肠胚显示出与我们的E14 WT 120小时类原肠胚相似的细胞类型组成,这表明我们的sciATACseq和类原肠胚实验方案具有稳健性和可重复性(

由于我们观察到MSGN1基序在体节中胚层—旁轴中胚层拟时序轨迹中富集,因此我们研究了MSGN1在类原肠胚发育过程中的作用。我们使用ΔMSGN1 mESCs进行了类原肠胚分化

我们的推理是,如果NMP向脊髓细胞的分化独立于MSGN1,而是依赖于不同细胞类型之间的相互作用,那么当这种相互作用环境由外源性方式提供时,NMP向脊髓细胞的分化应当能够发生。Gastruloid是进行这一研究的理想模型系统,因为可以混合不同的mESC细胞系来构建嵌合gastruloid。

与仅由ΔMSGN1 EGFP+细胞形成的gastruloid相比,由WT mCherry+和ΔMSGN1 EGFP+细胞组成的嵌合gastruloid在120 h时发生了延长(

在能够有效形成旁轴中胚层的WT细胞存在的情况下,ΔMSGN1细胞可以形成脊髓细胞。A)嵌合gastruloid的示意图,以及仅表达荧光团的WT、仅表达荧光团的ΔMSGN1和嵌合WT + ΔMSGN1 gastruloid在120小时的宽场荧光显微镜图像。比例尺:200 µm。B)WT、ΔMSGN1和嵌合gastruloid形态的定量分析(n = 2个生物学重复;重复1:WT:10个gastruloid,ΔMSGN1:10个gastruloid,嵌合体:10个gastruloid;重复2:WT:10个gastruloid,ΔMSGN1:11个gastruloid,嵌合体:9个gastruloid)。C)沿前后轴对嵌合gastruloid中荧光团强度的定量分析。D)120小时WT + ΔMSGN1嵌合gastruloid的共聚焦免疫荧光图像,染色标记FOXC1(蓝色)、SOX2(灰色)、EGFP(绿色)和mCherry(洋红色)。比例尺:200 µm。E)D中虚线方框所示区域的细节图,显示ΔMSGN1细胞对脊髓形成的贡献。SOX2和FOXC1如图所示为洋红色,EGFP为绿色。比例尺:200 µm。F)WT、ΔMSGN1和嵌合gastruloid中FOXC1和SOX2表达的定量分析。G)嵌合gastruloid中mCherry+(WT)区域和EGFP+(ΔMSGN1)区域内FOXC1和SOX2表达的归一化定量分析。通过计算强度的加权平均值,对每个gastruloid所有光学切片中的强度进行汇总,其中每个切片中的面积作为权重。每个重复的平均强度以对应WT样本的平均强度进行归一化。H)对嵌合gastruloid中测得的分化轨迹的示意性总结。

为了确定WT mCherry+细胞和ΔMSGN1 EGFP+细胞对中胚层和脊髓的贡献,我们进行了谱系标志物的免疫荧光分析。与未标记细胞的实验结果相反,我们在ΔMSGN1 EGFP+ gastruloid中未观察到多个CDX2+/TBXT+突起(图S4C、E;图S5A)。我们认为,这可能是由于为了实现细胞的EGFP标记而对ΔMSGN1 mESC进行了反复传代培养所致。与WT mCherry+ gastruloid相比,ΔMSGN1 EGFP+ gastruloid中FOXC1+中胚层以及SOX2+脊髓均显著减少,这与我们先前的观察结果一致(

在此,我们系统性地解析了小鼠类原肠胚发育过程中的染色质调控图谱,界定了这一合成胚胎模型中出现的主要调控亚型。我们发现,除初始祖细胞池外,大多数亚群与原肠胚形成后胚胎中的对应群体具有高度相似性。这种相似性表明,类原肠胚能够忠实重现后部胚胎发育中的细胞类型及其相关调控图谱,与转录组学研究的发现相一致。

来源于ΔCDX mESCs的类原肠胚缺乏NMP,但仍含有数量有限的脊髓细胞。在缺乏NMP的情况下仍存在这些脊髓细胞,提示细胞分化并非遵循僵化的轨迹,而是在经典路径受损时可能采取替代路径。然而,这一路径以及ΔCDX类原肠胚中脊髓细胞的来源目前仍不清楚。一种可能性是,它们直接来源于祖细胞池,从而绕过NMP阶段。另一种可能性是,由于CDX基因对于NMP状态的维持是必需的。

基于我们的拟时序分析,我们并未在脊髓/中胚层分叉的起始位置发现NMP,这与先前的建议不同。

通过分析旁轴中胚层轨迹主要驱动因子的突变体,我们证明了MSGN1的内在作用是在类原肠胚中促进旁轴中胚层的形成。

CRN无法在简单的单一培养体系中进行研究,因为根据定义,它们需要多种细胞类型之间的相互作用。然而,在发育中的胚胎和类原肠胚等多细胞结构中,对GRN的扰动可能产生意想不到的后果,正如我们所见。

在本研究中,我们使用了E14(IB10亚系)和HM1 mESC,两者均来源于129品系小鼠。

在嵌合类原肠胚实验中,按所示分别使用EGFP或mCherry对E14、HM1-ΔCDX和HM1-ΔMSGN1进行了遗传标记。该标记通过PiggyBac载体完成(由Bas van Steensel慷慨馈赠)。

类原肠胚按先前所述的方法进行培养。

编码Tn5的基因采用非连接酶依赖性克隆法(LIC)克隆至pETNKI-6xhis-SUMO3-LIC载体中,该载体含有N端6xHis-SUMO3标签。

重组Tn5蛋白在Rosetta2(DE3)细胞中于3升LB培养基中表达,培养基中补加30 µg/ml卡那霉素和40 µg/ml氯霉素。细胞在37°C下培养至OD。

Tn5蛋白基本按照先前所述的方法进行纯化。

对于bulk和单细胞ATAC实验,转座子通过将10 µL 10X TE缓冲液、45 µL 100 µM pMents寡核苷酸以及45 µL 100 µM相应的i5和i7寡核苷酸混合进行退火(详见寡核苷酸列表)。随后,将接头溶液于95ºC孵育10分钟,并以0.1ºC/秒降温至4ºC。为形成转座复合体,将退火后的接头以等体积稀释于H中。

sciATACseq按先前所述的方法进行。

简而言之,将50,000个mESCs收集于冷PBS中,并使用2×裂解缓冲液(Tris-HCl pH 7.5 1 M、NaCl 5 M、MgCl2 1 M、10% IGEPAL)进行裂解。随后,将细胞沉淀并与2×TD缓冲液和2 μL转座子混合液孵育。接着,使用KAPA HiFi HotStart ReadyMix及P5和P7带索引引物(见寡核苷酸列表)进行两轮PCR扩增。使用AMPure XP磁珠纯化长度在200至700 bp之间的片段。采用Bioanalyzer High Sensitivity DNA分析系统(Agilent)进行质量控制。

对单细胞组合索引ATAC-seq产生的fastq文件进行编辑,使fastq注释中的i5、i7、P5和P7条形码组合(以下称为“barcode”)以前缀“BC:Z:”添加,以便将条形码转移至比对文件中。编辑后的fastq文件使用bwa程序0.7.17-r118版本,并通过命令“bwa mem -MC”比对至mm10参考基因组。

当某一条形码对应至少2,000个唯一的核片段,且该条形码的TSS评分超过4时,该条形码被认为代表一个细胞。TSS评分通过对UCSC已知基因转录起始位点中心化的100个碱基对区域进行计算获得。

在二值化计数矩阵中,若某峰在少于2%的细胞中检测到片段,则将其排除。此外,我们还排除了距离TSS 1.5 kb以内的峰。

细胞聚类采用Leiden算法,在基于批次整合后主成分计算得到的共享最近邻(SNN)图上进行。SNN图使用bluster R/Bioconductor软件包中的“makeSNNGraph”函数构建。

基序的位置频率矩阵通过以下方法获得。

扩散拟时序使用destiny R/Bioconductor软件包进行计算。

如上所述,在合并胚胎数据和我们的gastruloid数据的片段上进行峰调用。细胞注释取自以下文献的补充数据。

使用Axios Observer Z1显微镜(Zeiss)测量gastruloid的形态以及荧光标记细胞的空间分布。对于形态学评分,在盲法条件下对gastruloid的宽场图像进行评分,并根据其形态将gastruloid分为卵圆形、延长形和多极形。对于ΔCDX gastruloid实验,使用Fiji测量轴比。

gastruloid的染色按照先前描述的方法进行。

对于图像定量分析,采用方差分析(ANOVA)。

我们谨向 de Wit 实验室的成员致谢,感谢他们对本手稿进行审阅并提出批判性意见。我们感谢 Alfonso Martinez Arias 对本手稿初稿提出的富有洞见的意见。我们感谢 James Briscoe 慷慨提供 CDX 和 MSGN1 敲除小鼠胚胎干细胞(ESC)系。我们感谢 NKI 的各项平台设施,尤其是流式细胞术平台在 sciATACseq 实验中的协助、高性能科研计算平台对计算分析的支持、基因组学核心平台提供的测序服务、高通量筛选平台对 gastruloid 培养自动化的支持,以及生物成像平台对显微分析的支持。de Wit 实验室的研究工作得到欧洲研究委员会(ERC)整合型资助项目(865459,“FuncDis3D”)以及荷兰研究委员会(NWO)Vidi 项目“016.16.316”的支持。L.B.、T.vd.B.、N.A.S. 和 E.d.W. 隶属于 Oncode,该机构部分由荷兰癌症协会资助。

注意:要求提供您的电子邮箱地址,仅用于将您识别为本文的发送者。


📄 原文链接:https://www.biorxiv.org/content/10.1101/2022.11.01.514697

🏷️ 胚胎样体 单细胞ATAC-seq 染色质可及性 基因调控网络 发育调控 转录因子