单细胞交响乐
  • 前言:我与《单细胞交响乐》的缘分
  • 1 准备篇:背景知识
    • 1.1 数据结构
    • 1.2 总览 | 从实验到分析
  • 2 积累篇:文献阅读
    • 2.1.1 综述 | 2019-单细胞转录组分析最佳思路
    • 2.1.2 综述 | 2018-单细胞捕获平台
    • 2.1.3 综述 | 2017-scRNA中的细胞聚类分群
    • 2.1.4 综述 | scRNA已经开发出超过1000款工具了,你用过几种?
    • 2.1.5 综述 | 2021-单细胞测序的微流控技术应用
    • 2.2.1 研究 | 2018-单细胞转录组探索癌症免疫治疗获得性抗性机理
    • 2.2.2 研究 | 2018-人类结直肠癌单细胞多组学分析
    • 2.2.3 研究 | 2020-单细胞分析揭示葡萄膜黑色素瘤新的进化复杂性
    • 2.2.4 研究 | 2020-COVID-19病人支气管免疫细胞单细胞测序分析
    • 2.2.5 研究 | 2020-原汁原味读--单细胞肿瘤免疫图谱
    • 2.2.6 研究 | 2021-多发性骨髓瘤发展过程中肿瘤和免疫细胞的共同进化
    • 2.2.7 研究 | 2021-多个组织的成纤维细胞图谱
    • 2.2.8 研究 | 2021-多组学分析肺结核队列的记忆T细胞状态
    • 2.2.9 研究 | 2021-CancerSCEM: 人类癌症单细胞表达图谱数据库
    • 2.2.10 研究| 2021-单细胞转录组分析COVID-19重症患者肺泡巨噬细胞亚型
    • 2.2.11 研究 |2021-单细胞转录组揭示肺腺癌特有的肿瘤微环境
    • 2.2.12 研究 | 2021-单细胞转录组揭示乳头状甲状腺癌起始与发展
    • 2.2.13 研究 | 2021-解析食管鳞癌化疗病人的单细胞转录组
    • 2.2.14 研究 | 2021-单细胞水平看骨髓瘤的细胞状态和基因调控
    • 2.3.1 算法|2020-BatchBench比较scRNA批次矫正方法
    • 2.3.2 算法 | 2021-scPhere——用地球仪来展示降维结果
    • 2.3.3 算法 | 2021-单细胞差异分析方法评测
    • 2.3.4 算法 | 2021-细胞分群新方法——CNA(co-varying neighborhood analysis)
    • 2.3.5 工具 | 2018-iSEE:单细胞数据可视化辅助网页工具
    • 2.3.6 工具 | 2021-MACA: 一款自动注释细胞类型的工具
    • 2.3.7 工具 | 2021-一个很有想法的工具——Ikarus,想要在单细胞水平直接鉴定肿瘤细胞
  • 3 流程篇:分析框架
    • 3.1 质控
    • 3.2 归一化
    • 3.3 挑选表达量高变化基因
    • 3.4 降维
    • 3.5 聚类
    • 3.6 Marker/标记基因检测
    • 3.7 细胞类型注释
    • 3.8 批次效应处理
    • 3.9 多样本间差异分析
    • 3.10 检测Doublet
    • 3.11 细胞周期推断
    • 3.12 细胞轨迹推断
    • 3.13 与蛋白丰度信息结合
    • 3.14 处理大型数据
    • 3.15 不同R包数据的相互转换
  • 4 实战篇:活学活用
    • 4.1 实战一 | Smart-seq2 | 小鼠骨髓
    • 4.2 实战二 | STRT-Seq | 小鼠大脑
    • 4.3 实战三 | 10X | 未过滤的PBMC
    • 4.4 实战四 | 10X | 过滤后的PBMC
    • 4.5 实战五 | CEL-seq2 | 人胰腺细胞
    • 4.6 实战六 | CEL-seq | 人胰腺细胞
    • 4.7 实战七 | SMARTer | 人胰腺细胞
    • 4.8 实战八 | Smart-seq2 | 人胰腺细胞
    • 4.9 实战九 | 不同技术数据整合 | 人胰腺细胞
    • 4.10 实战十 | CEL-seq | 小鼠造血干细胞
    • 4.11 实战十一 | Smart-seq2 | 小鼠造血干细胞
    • 4.12 实战十二 | 10X | 小鼠嵌合体胚胎
    • 4.13 实战十三 | 10X | 小鼠乳腺上皮细胞
    • 4.14 | 实战十四 | 10X | HCA计划的38万骨髓细胞
  • 5 补充篇:开拓思路
    • 5.1 10X Genomics概述
      • 5.1.1 10X Genomics 问题集锦
    • 5.2 CellRanger篇
      • 5.2.1 CellRanger实战(一)数据下载
      • 5.2.2 CellRanger实战(二) 使用前注意事项
      • 5.2.3 CellRanger实战(三) 使用初探
      • 5.2.4 CellRanger实战(四)流程概览
      • 5.2.5 CellRanger实战(五) 理解count输出的结果
    • 5.3 Seurat的使用
      • 5.3.1 Seurat V3 | 实战之2700 PBMCs分析
      • 5.3.2 Seurat V3 | 如何改造Seurat包的DoHeatmap函数?
      • 5.3.3 scRNA的3大R包对比
      • 5.3.4 Seurat两种数据比较:integrated vs RNA assay
      • 5.3.5 seurat 的几种findmaker比较
    • 5.4 Monocle的使用
      • 5.4.1 Monocle V3实战
    • 5.5 多个数据集的整合
      • 5.5.1 使用Seurat的merge功能进行整合
      • 5.5.2 如何使用sctransform去除批次效应
由 GitBook 提供支持
在本页
  • 前言
  • 一句话概括
  • 需要补充一点背景知识
  • 转录机制part1——表达
  • 既然表达有差异,那么接下来继续深入探索
  • 探索骨髓瘤细胞转录水平变化的方向
  • 转录机制part2——调控
  • 首先看基因调控网络GRN
  • 调控差异的产生,对染色质可接近性有影响吗?

这有帮助吗?

  1. 2 积累篇:文献阅读

2.2.14 研究 | 2021-单细胞水平看骨髓瘤的细胞状态和基因调控

刘小泽写于2021.11.04

上一页2.2.13 研究 | 2021-解析食管鳞癌化疗病人的单细胞转录组下一页2.3.1 算法|2020-BatchBench比较scRNA批次矫正方法

最后更新于3年前

这有帮助吗?

前言

题目:Dynamic transcriptional reprogramming leads to immunotherapeutic vulnerabilities in myeloma

日期:2021-10-21

期刊:Nature Cell Biology

链接:

一句话概括

7张主图+10张附图,而且每一张都至少有5-6张小图,使用上百张图片来说明:利用单细胞转录组+表观遗传分析骨髓瘤的细胞状态,从而研究异质性,帮助理解其中的基因调控网络,并帮助识别潜在的治疗靶点

需要补充一点背景知识

https://www.zs-hospital.sh.cn/zsyy/n33/n35/n48/n399/n403/u1ai3894.html

骨髓位于人体较大的骨骼的腔中,约占人体体重的 5%,含有间充质干细胞和造血干细胞

人体所有的血细胞都是由造血干细胞分化、增殖而成的,包括:红细胞、白细胞和血小板

  • 红细胞:可以将氧气从肺部输送至身体的各个部位

  • 血小板:具有止血功能

  • 白细胞:人体免疫系统的基石,包括淋巴细胞、单核细胞、粒细胞

浆细胞是淋巴细胞中 B 淋巴细胞分化的产物,它能分泌抗体,消灭入侵人体的病毒、细菌等。如果 B 淋巴细胞在分化成浆细胞的过程中 DNA 受到破坏,这个异变的浆细胞回到骨髓后,又再次受到环境的刺激时,就会发生癌变,也就成为了骨髓瘤细胞。

相比于正常的浆细胞,骨髓瘤细胞会以更快的速度分裂,并且分泌一种异变蛋白 - Paraprotein,这种异变蛋白没有抗体的免疫功能,医学上叫单克隆伽马球蛋白,或者单克隆丙种球蛋白

转录机制part1——表达

不过文章写了8个病人,但主图只显示了7个,而且也没看到说明原因

选取8个relapsed/refractory MM病人骨髓或血液中的骨髓瘤细胞以及CD45+ 免疫细胞,以及2个健康供体,使用SmartSeq2得到单细胞全长转录组,共 6,955 cells,利用PAGODA2进行分群,其中 clusters 20, 1, 5, 7, 14, 12, 3 and 13对应了CD4+ and CD8+ T cells, NK cells, B cells, monocytes and neutrophils(中性粒细胞);clusters 2, 4, 6, 8, 10, 11, 15, 16, 17 and 19对应了plasma cell

multiple myeloma (MM),多发性骨髓瘤

然后分析CNV区分恶性和非恶性细胞,不管是malignant score(图f)还是CNV扩展、缺失(图e),MM样本都要比ND正常样本高。另外还使用随机森林模型,寻找区分这两种类型细胞的marker基因,像是CCND1、FRZB13都是之前报道过的,而且这个CCND1在3/8的MM病人中都高表达。另外,还看了其他的signature,比如NFKB signature主要在MM1病人表达,proliferation signature PR 主要在MM8病人表达

既然表达有差异,那么接下来继续深入探索

首先推测:细胞周期对表达异质性会有影响

G、S、M期(https://en.wikipedia.org/wiki/Cell_cycle)

  • G1期(间期的DNA合成前期)

  • S期(间期的DNA合成期),启动DNA合成

  • G2期(间期的DNA合成后期)

  • M期(有丝分裂期),存在检测点和抑制点

发现分群之间没有太大的细胞周期差异(除了cluster10,可能因为这个cluster覆盖的病人样本比较多吧)

然后,使用非负矩阵分解(negative matrix factorization,NMF)

得到6个表达模式,除了细胞周期,还有很多细胞信号通路,包括KRAS–MAPK signalling, IL-2–STAT5 signalling, the interferon (IFN) response and IL-6–STAT3 signalling

探索骨髓瘤细胞转录水平变化的方向

BLUEPRINT不同的细胞类型:https://www.blueprint-epigenome.eu/index.cfm?p=7BCEDA45-EC73-3496-2C823D929DD423DB

使用BLUEPRINT数据集的不同细胞谱系的signature,发现骨髓瘤细胞的转录状态主要集中于浆细胞(PC)和一些未成熟的前体细胞(Megakaryocyte-erythroid precursor ,MEP)【图ab】,确实存在不同的变化阶段

接着利用RNA velocity analysis看了分化轨迹

得到一个由低分化向高分化的轨迹,正常样本的浆细胞聚集在尾部(标志着分化的结束),而正在分化的细胞聚在头部。再结合上图的e图,使用CytoTRACE看到骨髓瘤细胞具有比正常浆细胞更高的CytoTRACE score,标志着更好的分化潜能

接下来,看分化轨迹两端的差异

拿到CytoTRACE 分数高的细胞(也代表了未成熟状态),找到他们的top基因,做了通路(上图g),发现与代谢途径、Myc激活有关,还有一个plasmablast-like signature。

另外发现头尾具有截然相反的通路激活情况,比如上面的图h中MAPK通路,在头部高尾部低;而PI3K是尾部更高

转录机制part2——调控

首先看基因调控网络GRN

【图a】利用SCENIC看转录因子活性,利用BLUEPRINT数据,找到正常造血中的主导调控因子存在于浆细胞(PC module);

【图b】再看自己的数据:正常的供体中,这个PC module确实占主导;而骨髓瘤样本中,PC module除了在浆细胞,还在haemopoietic stem cell 、macrophage等类型中发现

接下来就是寻找骨髓瘤细胞特异的调控网络(图c),但其中好多调控元件在正常的数据中都没有或者很弱,比如ELF3、TEAD4(图d)

  • ELF3 is a member of the epithelium-specific ETS TFs expressed predominantly in epithelial tissues

  • TEAD4 acts as a downstream regulator of the Hippo pathway and binds to the M-CAT motif found primarily in muscle-specific genes

另外还发现了恶性和正常的浆细胞共有的一些调控元件,比如XBP1, IRF4 and PRDM1 ,说明骨髓瘤细胞还是保留了一些原有细胞谱系的印记

接着,引入一个指标(rewiring score),意思是看看一个调控元件改变后,与之相关的基因变化程度(在网络中可以理解为node对targets的影响;或者简单理解为rewiring score代表了影响力)。发现ELF3和TEAD4是两个得分最高的,其次是XBP1,说明它们对基因影响是比较大的。

调控差异的产生,对染色质可接近性有影响吗?

对5个病人+3个正常做了scATAC-seq,得到 1,483个细胞,注释分群得到:

  • clusters 1–6:plasma cell

  • clusters 7, 8 and 9:monocytes, B cells and NK cells

同时对比图b、c发现了cluster分群存在病人特异性,说明不同病人存在不同的染色质差异

接着做了peak calling,其中MM特有的是29,761个peaks,而正常特有的只有不到8000个;另外用DESeq2找了MM和正常的差异peaks,差异也是一致的(图c-d)

用ChromHMM对peaks进行注释,发现很多MM的peaks落在了异染色质,并且在intronic and intergenic区域更多,说明MM可能募集到更多的增强子enhancer;同时发现MM的可开放区域距离TSS很远,这个和之前报道的骨髓瘤H3K27 乙酰化程度升高一致

为了阐释scATAC数据集的差异,做了拟时序分析。发现在MM中比较重要的一些基因,比如CCND1和ELF3,在轨迹的”头部“表现更高的开放程度【主图e】,又分析了motif accessibility,发现NF-κB family members REL, RELA and NFKB1 得分比较高,并且集中于”尾部“的正常样本。用chromVAR 进行差异分析,得到276个TFs。

图i-j基于ELF3 and TEAD4 预测了顺式作用因子, 为MM中存在增强子激活再次提供证据

image-20211104165510661
image-20211104163825168
https://www.nature.com/articles/s41556-021-00766-y
image-20211104103909490