单细胞交响乐
  • 前言:我与《单细胞交响乐》的缘分
  • 1 准备篇:背景知识
    • 1.1 数据结构
    • 1.2 总览 | 从实验到分析
  • 2 积累篇:文献阅读
    • 2.1.1 综述 | 2019-单细胞转录组分析最佳思路
    • 2.1.2 综述 | 2018-单细胞捕获平台
    • 2.1.3 综述 | 2017-scRNA中的细胞聚类分群
    • 2.1.4 综述 | scRNA已经开发出超过1000款工具了,你用过几种?
    • 2.1.5 综述 | 2021-单细胞测序的微流控技术应用
    • 2.2.1 研究 | 2018-单细胞转录组探索癌症免疫治疗获得性抗性机理
    • 2.2.2 研究 | 2018-人类结直肠癌单细胞多组学分析
    • 2.2.3 研究 | 2020-单细胞分析揭示葡萄膜黑色素瘤新的进化复杂性
    • 2.2.4 研究 | 2020-COVID-19病人支气管免疫细胞单细胞测序分析
    • 2.2.5 研究 | 2020-原汁原味读--单细胞肿瘤免疫图谱
    • 2.2.6 研究 | 2021-多发性骨髓瘤发展过程中肿瘤和免疫细胞的共同进化
    • 2.2.7 研究 | 2021-多个组织的成纤维细胞图谱
    • 2.2.8 研究 | 2021-多组学分析肺结核队列的记忆T细胞状态
    • 2.2.9 研究 | 2021-CancerSCEM: 人类癌症单细胞表达图谱数据库
    • 2.2.10 研究| 2021-单细胞转录组分析COVID-19重症患者肺泡巨噬细胞亚型
    • 2.2.11 研究 |2021-单细胞转录组揭示肺腺癌特有的肿瘤微环境
    • 2.2.12 研究 | 2021-单细胞转录组揭示乳头状甲状腺癌起始与发展
    • 2.2.13 研究 | 2021-解析食管鳞癌化疗病人的单细胞转录组
    • 2.2.14 研究 | 2021-单细胞水平看骨髓瘤的细胞状态和基因调控
    • 2.3.1 算法|2020-BatchBench比较scRNA批次矫正方法
    • 2.3.2 算法 | 2021-scPhere——用地球仪来展示降维结果
    • 2.3.3 算法 | 2021-单细胞差异分析方法评测
    • 2.3.4 算法 | 2021-细胞分群新方法——CNA(co-varying neighborhood analysis)
    • 2.3.5 工具 | 2018-iSEE:单细胞数据可视化辅助网页工具
    • 2.3.6 工具 | 2021-MACA: 一款自动注释细胞类型的工具
    • 2.3.7 工具 | 2021-一个很有想法的工具——Ikarus,想要在单细胞水平直接鉴定肿瘤细胞
  • 3 流程篇:分析框架
    • 3.1 质控
    • 3.2 归一化
    • 3.3 挑选表达量高变化基因
    • 3.4 降维
    • 3.5 聚类
    • 3.6 Marker/标记基因检测
    • 3.7 细胞类型注释
    • 3.8 批次效应处理
    • 3.9 多样本间差异分析
    • 3.10 检测Doublet
    • 3.11 细胞周期推断
    • 3.12 细胞轨迹推断
    • 3.13 与蛋白丰度信息结合
    • 3.14 处理大型数据
    • 3.15 不同R包数据的相互转换
  • 4 实战篇:活学活用
    • 4.1 实战一 | Smart-seq2 | 小鼠骨髓
    • 4.2 实战二 | STRT-Seq | 小鼠大脑
    • 4.3 实战三 | 10X | 未过滤的PBMC
    • 4.4 实战四 | 10X | 过滤后的PBMC
    • 4.5 实战五 | CEL-seq2 | 人胰腺细胞
    • 4.6 实战六 | CEL-seq | 人胰腺细胞
    • 4.7 实战七 | SMARTer | 人胰腺细胞
    • 4.8 实战八 | Smart-seq2 | 人胰腺细胞
    • 4.9 实战九 | 不同技术数据整合 | 人胰腺细胞
    • 4.10 实战十 | CEL-seq | 小鼠造血干细胞
    • 4.11 实战十一 | Smart-seq2 | 小鼠造血干细胞
    • 4.12 实战十二 | 10X | 小鼠嵌合体胚胎
    • 4.13 实战十三 | 10X | 小鼠乳腺上皮细胞
    • 4.14 | 实战十四 | 10X | HCA计划的38万骨髓细胞
  • 5 补充篇:开拓思路
    • 5.1 10X Genomics概述
      • 5.1.1 10X Genomics 问题集锦
    • 5.2 CellRanger篇
      • 5.2.1 CellRanger实战(一)数据下载
      • 5.2.2 CellRanger实战(二) 使用前注意事项
      • 5.2.3 CellRanger实战(三) 使用初探
      • 5.2.4 CellRanger实战(四)流程概览
      • 5.2.5 CellRanger实战(五) 理解count输出的结果
    • 5.3 Seurat的使用
      • 5.3.1 Seurat V3 | 实战之2700 PBMCs分析
      • 5.3.2 Seurat V3 | 如何改造Seurat包的DoHeatmap函数?
      • 5.3.3 scRNA的3大R包对比
      • 5.3.4 Seurat两种数据比较:integrated vs RNA assay
      • 5.3.5 seurat 的几种findmaker比较
    • 5.4 Monocle的使用
      • 5.4.1 Monocle V3实战
    • 5.5 多个数据集的整合
      • 5.5.1 使用Seurat的merge功能进行整合
      • 5.5.2 如何使用sctransform去除批次效应
由 GitBook 提供支持
在本页
  • 1 文章信息
  • 2 前言
  • 2.1 摘要
  • 2.2 研究背景
  • 3 方法
  • 3.1 样本收集
  • 3.2 scRNA-seq和TCR-seq捕获、文库构建、测序
  • 3.3 scRNA-seq数据的比对和整合
  • 3.4 降维和聚类分群
  • 3.5 巨噬细胞、NK、T细胞的重新整合
  • 3.6 差异基因表达分析
  • 3.7 调控网络推断
  • 3.8 富集分析
  • 3.9 TCR V(D)J 测序分析
  • 3.10 数据
  • 4 结果
  • 4.1 COVID-19的重度患者支气管肺泡免疫功能失调
  • 4.2 COVID-19患者BALFs中T淋巴细胞和NK淋巴细胞的分析
  • 4.3 COVID-19患者BALF 中T细胞克隆扩增分析
  • 4.4 患者几种细胞素和趋化因子的测量
  • 5 意义与不足

这有帮助吗?

  1. 2 积累篇:文献阅读

2.2.4 研究 | 2020-COVID-19病人支气管免疫细胞单细胞测序分析

刘小泽写于2020.5.21

上一页2.2.3 研究 | 2020-单细胞分析揭示葡萄膜黑色素瘤新的进化复杂性下一页2.2.5 研究 | 2020-原汁原味读--单细胞肿瘤免疫图谱

最后更新于4年前

这有帮助吗?

1 文章信息

题目:Single-cell landscape of bronchoalveolar immune cells in patients with COVID-19

投稿日期:2020年2月24日

接收日期:2020年4月23日

发表日期:2020年5月12日

杂志:Brief Communication

文章在:

DOI:

文章使用的代码在:

2 前言

2.1 摘要

与COVID-19严重性相关的呼吸免疫特性目前还不清楚。作者选了COVID-19严重程度不同的患者以及健康人的支气管肺泡灌洗液免疫细胞,进行单细胞转录组测序。发现重度患者的支气管肺泡灌洗液中富含巨噬细胞,普通型患者的特点是存在高度克隆扩增的CD8+ T细胞。

支气管肺泡灌洗(bronchoalveolar lavage, BAL):经支气管镜向局部支气管肺泡注入生理盐水,随即进行抽吸而获取支气管肺泡表面被覆液与灌入生理盐水混合液的一种方法。BAL可通过支气管肺泡灌洗液(bronchoalveolar lavage fluid, BALF)细胞学、肿瘤标志物等检测解决常规支气管镜未能见到的异常肺部病变的诊断,特别是周围性、原发性或继发性恶性肿瘤等,往往被称为“液相活检” (

2.2 研究背景

COVID-19的潜在免疫反应至今未知,在动物实验模型中发现了异常的免疫反应,特点是淋巴细胞减少。支气管肺泡灌洗液(BALF)含有细支气管和肺泡的微环境信息,因此选择它作为实验材料。

3 方法

3.1 样本收集

用于scRNA-seq研究的有9名病人,其中普通型有3个(M1-M3),重型有1个(S1)、危重症有5个(S2-S6),他们平均年龄57岁,其中6名男性3名女性。它们的人口调查数据在附表一。为了评估细胞因子和趋化因子水平,检查了其他几名病人的支气管肺泡灌洗液(S7-S10,他们的人口调查数据在附表四)

来自维基百科: 细胞因子(英語:cytokine,又稱细胞介素、细胞激素、细胞素、细胞活素),是一组蛋白质及多肽,在生物中用作信号蛋白。 这些类似激素或神经递质的蛋白用作细胞间沟通的信号。可以由多种细胞释放,尤其重要的是在先天性免疫反应和适应性免疫反应。 趋化因子(chemokines),也称做趋化激素、趋化素或是化学激素。是一小分子细胞因子家族蛋白。主要作用是趋化细胞的迁移. 细胞沿着趋化因子浓度增加的信号向趋化因子源处的迁徙。有些趋化因子在免疫监视过程中控制免疫细胞趋化,如诱导淋巴细胞到淋巴结。 这些淋巴结中的趋化因子通过与这些组织中的抗原提呈细胞相互作用而监视病原体的入侵。这些被称为稳态趋化因子

除此以外,还有3个健康供体作为对照(HC1-HC3),他们均没有结核、肿瘤等肺部疾病(他们的人口调查数据也在附表四)

3.2 scRNA-seq和TCR-seq捕获、文库构建、测序

对HC1和HC2利用10X Genomics的Chromium Single Cell 3g Reagent kits v.2进行捕获和构建文库,HC3利用kit v.3;COVID-19的所有病人利用Chromium Single Cell V(D)J Reagent kits用于单细胞免疫研究;利用BGI MGISEQ-2000或Illumina平台进行测序

除了上面三个供体,scRNA-seq分析还利用了一个公共数据( GSE128033 中的GSM3660650)进行佐证(记为HC4),是肺移植供体的新鲜支气管肺泡灌洗液的单细胞测序数据

3.3 scRNA-seq数据的比对和整合

利用了cellranger v3.1.0,为了检测SARS-CoV-2的reads,在分析时将GRCh38和SARS-CoV-2基因组序列(GenBank:MN908947.3)进行整合;cellranger中利用STAR进行比对。

针对9个病人的表达矩阵的质控阈值是:基因数量200-6000,UMI count大于1000,线粒体含量小于10%。过滤后,总共得到66452个细胞

利用Seurat V3将来自不同供体的单细胞数据进行整合,并去除批次效应

3.4 降维和聚类分群

基于Seurat V3,使用LogNormalize 的默认参数进行归一化,利用FindVariableFeatures的vst方法选top2000高变化基因(HVGs);在标准化这步(scale),去掉了nCount_RNA和percent.mito的影响,后续利用2000个基因进行PCA。之后基于PCA结果,利用前50主成分进行UMAP,同时进行graph-based clustering(参数resolution=1.2)【例如scanpy就是graph-based clustering】

  • Currently, the most widely used graph-based methods for single cell data are variants of the louvain algorithm

  • Community detection methods (also referred to as 'graph-based clustering') are typically faster than other clustering methods with similar effectiveness.

  • This resolution parameter controls how fine- or coarse-grained the inferred clusters are. This parameter can have major effects on your results!

3.5 巨噬细胞、NK、T细胞的重新整合

利用Seurat V3将所有样本的巨噬细胞中前50个CCA( canonical correlation analysis)和PCA进行整合【参数:k.filter=115 考虑到M3样本中细胞数量较少】,聚类这步参数resolution=0.8 ;

对于所有的NK和T细胞的整合,由于T细胞数量在HC2和S3样本中较少,所以将它们排除。参数k.filter=175

另外单独将8个病人样本的T细胞(排出了S3)进行整合,为了之后的TCR分析,参数k.filter=140

3.6 差异基因表达分析

Seurat3利用FindAllMarkers函数中整合的MAST算法进行差异分析(结果在附表5)

3.7 调控网络推断

利用SCENIC构建了4个巨噬细胞群的调控网络,其中利用了SCENIC v.0.9.19中的GRNBoost2基于原始表达量进行推断。

3.8 富集分析

利用clusterProfiler对差异基因进行GO、GSEA(利用了50个 hallmark gene sets in MSigDB)

3.9 TCR V(D)J 测序分析

使用Chromium Single-Cell V(D)J Enrichment kit进行 5' 全长建库,每个T细胞使用Cell Ranger vdj pipeline (v.3.1.0)流程处理。同时具有TCR α- 和 β-chains的细胞保留,只要一个chain的细胞丢弃;对于含有两个以上α-chains或者 β-chains的细胞,比如一个细胞有α-chain-1、α-chain-2 、β-chain,但α-chain-2的UMI高于α-chain-1,于是舍弃α-chain-1

3.10 数据

4 结果

4.1 COVID-19的重度患者支气管肺泡免疫功能失调

图A:对支气管肺泡灌洗液免疫细胞进行分群后进行细胞·类型鉴定,UMAP展示出13种细胞类型 图B:主要的支气管肺泡灌洗液免疫细胞在健康、中度、重度患者中的分布 图C:UMAP展示了4组巨噬细胞在健康、中度、重度患者中的分布 图D:支气管肺泡灌洗液巨噬细胞的三个基因表达(FCN1, SPP1 and FABP4)

根据marker基因鉴定了31个亚群:

其中包括:macrophages (CD68), neutrophils (FCGR3B), myeloid dendritic cells (mDCs) (CD1C, CLEC9A), plasmacytoid dendritic cells (pDCs) (LILRA4), natural killer (NK) cells (KLRD1), T cells (CD3D), B cells (MS4A1), plasma cells (IGHG4) and epithelial cells (TPPP3, KRT18)

主要的细胞类型(mDCs, pDCs, mast cells, NK cells, T cells and B cells)在大部分样本中都存在,但发现巨噬细胞在不同组中含量差别大

相比普通型患者,重度患者的巨噬细胞(macrophages)和中性粒细胞(neutrophils)占比增加,mDCs, pDCs and T细胞占比下降

然后对20个巨噬细胞的亚群重新聚类

并根据最新的分类标准和marker基因,将巨噬细胞分成4组(FCN1hi group 1, FCN1loSPP1+ group 2, SPP1+ group 3 and FABP4+ group)

看到这4个组在FCN1, SPP1 and FABP4基因表达量以及细胞组成方面差异都比较大

再看这几个基因:FABP4在对照和轻度患者中表达高;FCN1和SPP1在重型和危重型患者中表达高

为进一步探究4个组之间差别,进行了差异分析、GO富集和GSEA

第一组表达了外周单核细胞基因S100A8, FCN1 and CD14;

第二组高表达趋化因子CCL2, CCL3, CXCL10;

两组的表达模式更像M1型巨噬细胞

第三组表达免疫调节基因A2M, GPR183 and CCL13 以及纤维化基因TREM2, TGFB1 and SPP1,说明可能是M2型巨噬细胞

第四组表达肺泡巨噬细胞基因FABP4, APOC1, MARCO 以及脂质代谢功能相关基因,而且结合之前的分群结果,第四组主要在对照和轻度患者中存在

利用SCENIC计算4组巨噬细胞基因的调节程度

在第一组和第二组中,发现转录因子基因NFκB, STAT1, STAT2 和干扰素调控因子上调;在第三组中,促M2型基因TFEB, NR1H3, PPARA and CREB1上调;第四组中,肺泡巨噬细胞特异基因PPARG和CEBPB上调

表示:严重COVID-19的患者的肺中存在高度促炎症的巨噬细胞微环境,这与之前在稳态、发炎、恢复状态下的巨噬细胞群体的认识一致

4.2 COVID-19患者BALFs中T淋巴细胞和NK淋巴细胞的分析

根据一些marker基因鉴定了6个T、NK淋巴细胞群

与中度感染患者相比,重症感染患者的CD8 + T细胞含量较低,而增殖T细胞的比例较高

这些CD8+ T细胞表达了更高水平的GZMA、GZMK和FASLG以及组织驻留标记ITGA1、CXCR6和JAML

轻度病例中涉及激活、迁移和细胞因子相关通路的基因上调,重度病例中涉及翻译起始、细胞稳态和核苷酸代谢通路的基因上调

4.3 COVID-19患者BALF 中T细胞克隆扩增分析

使用scTCR-seq对8个COVID-19患者(排除了S3)BALF的7个T细胞群分析了T细胞克隆扩增

克隆性扩增的T细胞的UMAP结果显示:在轻度患者中聚集分布,而在重症患者中离散分布,说明它们在转录状态上就存在同质性和异质性的区别

轻度和重度患者的CD8+ T细胞在数量和克隆性扩增状态存在差异:

总之,重症/危重症患者提取的CD8+ T细胞扩撒范围更小,但具有更高的增值特性和表型异质性,在轻度患者中,CD8+ T细胞具有组织原位的特性

4.4 患者几种细胞素和趋化因子的测量

重症/危重症患者比轻症患者的炎症细胞因子含量更高,尤其是IL-8、IL-6、IL-1β

IL1B, IL6, TNF 和几种趋化因子 (CCL2, CCL3, CCL4 and CCL7)在重症患者的巨噬细胞中高表达;CXCL9, CXCL10 and CXCL11在患者中表达量高于正常人;CXCL16(它的产物与CXCR6结合)在轻度患者中表达比重症患者高

总之,重症患者肺部的巨噬细胞可能通过CCR1和CXCR2招募炎症单核细胞和中性粒细胞,导致局部发炎;轻度患者的巨噬细胞通过CXCR3和CXCR6产生更多的T细胞趋化因子

5 意义与不足

说明了细胞素风暴与COVID-19的严重程度有关

细胞素风暴(Cytokine storm):又称高细胞因子症(英语:Hypercytokinemia),一种不适当的免疫反应,因为细胞因子与免疫细胞间的正回馈回路而产生。这也被认为是1918年流感大流行、2003年SARS事件、2009年H1N1流感大流行,以及H5N1高致病性禽流感中病毒致死的原因 当免疫系统对抗病原体时,细胞因子会引导免疫细胞前往受感染处。同时,细胞因子也会激活这些免疫细胞,被激活的免疫细胞则会产生更多的细胞素。通常来说,人体会检查并控制这个反馈循环。但是在有些情况下,情况会失控,导致一个地方聚集了太多被激活的免疫细胞。

揭示了在COVID-19中潜在的免疫发病机制中巨噬细胞和T细胞异常反应

存在的不足:病人数量少,并存在异质性;缺少纵向比较(比如感染前后组织的收集测序);B细胞的反应由于数量少没有进行分析;年龄及患者之前存在的问题没有全面考虑

2020年1-2月取自深圳第三人民医院的13个病人,并根据新型冠状病毒肺炎诊疗方案(

V(D)J:与体细胞相比,B 细胞和 T 细胞是独特的,其发育和成熟是由生殖细胞系中未编码的 DNA 序列决定的。在成熟过程中,这些细胞经历了可变区(V)、多样区(D)和结合区(J)【联系记忆:variaty、diversity、joint】基因片段的冲排,以便形成独特的序列 免疫学研究综述 - Illumina:

关于Graph-based methods :

使用的所有数据在 ,代码在:

Fig. 1
https://www.nature.com/articles/s41591-020-0901-9
https://doi.org/10.1038/s41591-020-0901-9
https://github.com/zhangzlab/covid_balf
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000434/)
http://www.nhc.gov.cn/yzygj/s7653p/202003/46c9294a7dfe4cef80dc7f5912eb1989.shtml)将病人划分成普通型(moderate)、重型(severe)、危重型(critical)。
http://web.illumina.com.cn/landing/products_view.asp?newsid=155
https://chanzuckerberg.github.io/scRNA-python-workshop/analysis/04-clustering.html
GSE145926
https://github.com/zhangzlab/covid_balf