# 2.2.4 研究 | 2020-COVID-19病人支气管免疫细胞单细胞测序分析

## 1 文章信息

题目：Single-cell landscape of bronchoalveolar immune cells in patients with COVID-19

投稿日期：2020年2月24日

接收日期：2020年4月23日

发表日期：2020年5月12日

杂志：Brief Communication

文章在：<https://www.nature.com/articles/s41591-020-0901-9>

DOI：<https://doi.org/10.1038/s41591-020-0901-9>

文章使用的代码在：<https://github.com/zhangzlab/covid_balf>

## 2 前言

### **2.1 摘要**

与COVID-19严重性相关的呼吸免疫特性目前还不清楚。作者选了COVID-19严重程度不同的患者以及健康人的支气管肺泡灌洗液免疫细胞，进行单细胞转录组测序。发现重度患者的支气管肺泡灌洗液中富含巨噬细胞，普通型患者的特点是存在高度克隆扩增的CD8+ T细胞。

> **支气管肺泡灌洗（bronchoalveolar lavage, BAL）**：经支气管镜向局部支气管肺泡注入生理盐水，随即进行抽吸而获取支气管肺泡表面被覆液与灌入生理盐水混合液的一种方法。BAL可通过支气管肺泡灌洗&#x6DB2;**（bronchoalveolar lavage fluid, BALF）**&#x7EC6;胞学、肿瘤标志物等检测**解决常规支气管镜未能见到的异常肺部病变的诊断**，特别是周围性、原发性或继发性恶性肿瘤等，往往被称为“**液相活检**” （[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000434/）](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000434/%EF%BC%89)

### **2.2 研究背景**

COVID-19的潜在免疫反应至今未知，在动物实验模型中发现了异常的免疫反应，特点是淋巴细胞减少。支气管肺泡灌洗液(BALF)含有细支气管和肺泡的微环境信息，因此选择它作为实验材料。

## 3 方法

### **3.1 样本收集**

2020年1-2月取自深圳第三人民医院的13个病人，并根据新型冠状病毒肺炎诊疗方案（[http://www.nhc.gov.cn/yzygj/s7653p/202003/46c9294a7dfe4cef80dc7f5912eb1989.shtml）将病人划分成普通型（moderate）、重型（severe）、危重型（critical）。](http://www.nhc.gov.cn/yzygj/s7653p/202003/46c9294a7dfe4cef80dc7f5912eb1989.shtml%EF%BC%89%E5%B0%86%E7%97%85%E4%BA%BA%E5%88%92%E5%88%86%E6%88%90%E6%99%AE%E9%80%9A%E5%9E%8B%EF%BC%88moderate%EF%BC%89%E3%80%81%E9%87%8D%E5%9E%8B%EF%BC%88severe%EF%BC%89%E3%80%81%E5%8D%B1%E9%87%8D%E5%9E%8B%EF%BC%88critical%EF%BC%89%E3%80%82)

用于scRNA-seq研究的有9名病人，其中普通型有3个（M1-M3），重型有1个（S1）、危重症有5个（S2-S6），他们平均年龄57岁，其中6名男性3名女性。它们的人口调查数据在附表一。为了评估细胞因子和趋化因子水平，检查了其他几名病人的支气管肺泡灌洗液（S7-S10，他们的人口调查数据在附表四）

> 来自维基百科： **细胞因子**（英語：**cytokine**，又稱细胞介素、细胞激素、细胞素、细胞活素），是一组蛋白质及多肽，在生物中用作信号蛋白。 这些类似激素或神经递质的蛋白用作细胞间沟通的信号。可以由多种**细胞**释放，尤其重要的是在先天性免疫反应和适应性免疫反应。 **趋化因子（chemokines）**，也称做趋化激素、趋化素或是化学激素。是一小分子细胞因子家族蛋白。主要作用是趋化细胞的迁移. 细胞沿着趋化因子浓度增加的信号向趋化因子源处的迁徙。有些趋化因子在**免疫监视**过程中控制免疫细胞趋化，如诱导淋巴细胞到淋巴结。 这些淋巴结中的趋化因子通过与这些组织中的抗原提呈细胞相互作用而监视病原体的入侵。这些被称为**稳态趋化因子**

除此以外，还有3个健康供体作为对照（HC1-HC3），他们均没有结核、肿瘤等肺部疾病（他们的人口调查数据也在附表四）

### **3.2 scRNA-seq和TCR-seq捕获、文库构建、测序**

对HC1和HC2利用10X Genomics的Chromium Single Cell 3g Reagent kits v.2进行捕获和构建文库，HC3利用kit v.3；COVID-19的所有病人利用Chromium Single Cell V(D)J Reagent kits用于单细胞免疫研究；利用BGI MGISEQ-2000或Illumina平台进行测序

> V(D)J：与体细胞相比，B 细胞和 T 细胞是独特的，其发育和成熟是由生殖细胞系中未编码的 DNA 序列决定的。在成熟过程中，这些细胞经历了可变区（V）、多样区（D）和结合区（J）【联系记忆：variaty、diversity、joint】基因片段的冲排，以便形成独特的序列 免疫学研究综述 - Illumina：<http://web.illumina.com.cn/landing/products_view.asp?newsid=155>

除了上面三个供体，scRNA-seq分析还利用了一个公共数据（ GSE128033 中的GSM3660650）进行佐证（记为HC4），是肺移植供体的新鲜支气管肺泡灌洗液的单细胞测序数据

### **3.3 scRNA-seq数据的比对和整合**

利用了cellranger v3.1.0，为了检测SARS-CoV-2的reads，在分析时将GRCh38和**SARS-CoV-2基因组序列（GenBank：MN908947.3）进行整合**；cellranger中利用STAR进行比对。

针对9个病人的表达矩阵的质控**阈值是：基因数量200-6000，UMI count大于1000，线粒体含量小于10%**。过滤后，总共得到66452个细胞

利用Seurat V3将来自不同供体的单细胞数据进行整合，并去除批次效应

### **3.4 降维和聚类分群**

基于Seurat V3，使用`LogNormalize` 的默认参数进行归一化，利用`FindVariableFeatures`的`vst`方法选top2000高变化基因（HVGs）；在标准化这步（scale），去掉了`nCount_RNA`和`percent.mito`的影响，后续利用2000个基因进行PCA。之后基于PCA结果，利用前50主成分进行UMAP，同时进行graph-based clustering（参数resolution=1.2）【例如scanpy就是graph-based clustering】

> 关于Graph-based methods ：<https://chanzuckerberg.github.io/scRNA-python-workshop/analysis/04-clustering.html>
>
> * Currently, the most widely used graph-based methods for single cell data are variants of the **louvain** algorithm
> * **Community detection** methods (also referred to as '**graph-based clustering**')   are typically faster than other clustering methods with similar effectiveness.
> * This **resolution parameter** controls how fine- or coarse-grained the inferred clusters are. This parameter can have major effects on your results!

### **3.5 巨噬细胞、NK、T细胞的重新整合**

利用Seurat V3将所有样本的巨噬细胞中前50个CCA（ canonical correlation analysis）和PCA进行整合【参数：`k.filter=115` 考虑到M3样本中细胞数量较少】，聚类这步参数`resolution=0.8` ；

对于所有的NK和T细胞的整合，由于T细胞数量在HC2和S3样本中较少，所以将它们排除。参数`k.filter=175`

另外单独将8个病人样本的T细胞（排出了S3）进行整合，为了之后的TCR分析，参数`k.filter=140`

### **3.6 差异基因表达分析**

Seurat3利用`FindAllMarkers`函数中整合的MAST算法进行差异分析（结果在附表5）

### **3.7 调控网络推断**

利用SCENIC构建了4个巨噬细胞群的调控网络，其中利用了SCENIC v.0.9.19中的GRNBoost2基于原始表达量进行推断。

### **3.8 富集分析**

利用clusterProfiler对差异基因进行GO、GSEA（利用了50个 hallmark gene sets in MSigDB）

### **3.9 TCR V(D)J 测序分析**

使用Chromium Single-Cell V(D)J Enrichment kit进行 5' 全长建库，每个T细胞使用Cell Ranger vdj pipeline (v.3.1.0)流程处理。同时具有TCR α- 和 β-chains的细胞保留，只要一个chain的细胞丢弃；对于含有两个以上α-chains或者 β-chains的细胞，比如一个细胞有α-chain-1、α-chain-2 、β-chain，但α-chain-2的UMI高于α-chain-1，于是舍弃α-chain-1

### **3.10 数据**

使用的所有数据在 [GSE145926](http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE145926)，代码在：<https://github.com/zhangzlab/covid_balf>

## 4 结果

### **4.1 COVID-19的重度患者支气管肺泡免疫功能失调**

![Fig. 1](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-032201.png)

> 图A：对支气管肺泡灌洗液免疫细胞进行分群后进行细胞·类型鉴定，UMAP展示出13种细胞类型 图B：主要的支气管肺泡灌洗液免疫细胞在健康、中度、重度患者中的分布 图C：UMAP展示了4组巨噬细胞在健康、中度、重度患者中的分布 图D：支气管肺泡灌洗液巨噬细胞的三个基因表达（FCN1, SPP1 and FABP4）

**根据marker基因鉴定了31个亚群：**

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-033959.png)

其中包括：macrophages (CD68), neutrophils (FCGR3B), myeloid dendritic cells (mDCs) (CD1C, CLEC9A), plasmacytoid dendritic cells (pDCs) (LILRA4), natural killer (NK) cells (KLRD1), T cells (CD3D), B cells (MS4A1), plasma cells (IGHG4) and epithelial cells (TPPP3, KRT18)

主要的细胞类型（mDCs, pDCs, mast cells, NK cells, T cells and B cells）在大部分样本中都存在，但发现巨噬细胞在不同组中含量差别大

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-034846.png)

相比普通型患者，重度患者的巨噬细胞（macrophages）和中性粒细胞（neutrophils）占比增加，mDCs, pDCs and T细胞占比下降

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-035355.png)

**然后对20个巨噬细胞的亚群重新聚类**

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-035606.png)

并根据最新的分类标准和marker基因，将巨噬细胞分成4组（FCN1hi group 1, FCN1loSPP1+ group 2, SPP1+ group 3 and FABP4+ group）

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-035746.png)

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-035950.png)

看到这4个组在FCN1, SPP1 and FABP4基因表达量以及细胞组成方面差异都比较大

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-040553.png)

再看这几个基因：FABP4在对照和轻度患者中表达高；FCN1和SPP1在重型和危重型患者中表达高

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-040352.png)

**为进一步探究4个组之间差别，进行了差异分析、GO富集和GSEA**

第一组表达了外周单核细胞基因S100A8, FCN1 and CD14；

第二组高表达趋化因子CCL2, CCL3, CXCL10；

两组的表达模式更像M1型巨噬细胞

第三组表达免疫调节基因A2M, GPR183 and CCL13 以及纤维化基因TREM2, TGFB1 and SPP1，说明可能是M2型巨噬细胞

第四组表达肺泡巨噬细胞基因FABP4, APOC1, MARCO 以及脂质代谢功能相关基因，而且结合之前的分群结果，第四组主要在对照和轻度患者中存在

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-040845.png)

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-042134.png)

**利用SCENIC计算4组巨噬细胞基因的调节程度**

在第一组和第二组中，发现转录因子基因NFκB, STAT1, STAT2 和干扰素调控因子上调；在第三组中，促M2型基因TFEB, NR1H3, PPARA and CREB1上调；第四组中，肺泡巨噬细胞特异基因PPARG和CEBPB上调

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-042256.png)

表示：严重COVID-19的患者的肺中存在高度促炎症的巨噬细胞微环境，这与之前在稳态、发炎、恢复状态下的巨噬细胞群体的认识一致

### **4.2 COVID-19患者BALFs中T淋巴细胞和NK淋巴细胞的分析**

根据一些marker基因鉴定了6个T、NK淋巴细胞群

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-043222.png)

与中度感染患者相比，重症感染患者的CD8 + T细胞含量较低，而增殖T细胞的比例较高

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-043416.png)

这些CD8+ T细胞表达了更高水平的GZMA、GZMK和FASLG以及组织驻留标记ITGA1、CXCR6和JAML

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-043502.png)

轻度病例中涉及激活、迁移和细胞因子相关通路的基因上调，重度病例中涉及翻译起始、细胞稳态和核苷酸代谢通路的基因上调

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-043532.png)

### **4.3 COVID-19患者BALF 中T细胞克隆扩增分析**

使用scTCR-seq对8个COVID-19患者（排除了S3）BALF的7个T细胞群分析了T细胞克隆扩增

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-18-043859.png)

克隆性扩增的T细胞的UMAP结果显示：在轻度患者中聚集分布，而在重症患者中离散分布，说明它们在转录状态上就存在同质性和异质性的区别

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-19-122449.png)

轻度和重度患者的CD8+ T细胞在数量和克隆性扩增状态存在差异：

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-19-122725.png)

总之，重症/危重症患者提取的CD8+ T细胞扩撒范围更小，但具有更高的增值特性和表型异质性，在轻度患者中，CD8+ T细胞具有组织原位的特性

### **4.4 患者几种细胞素和趋化因子的测量**

重症/危重症患者比轻症患者的炎症细胞因子含量更高，尤其是IL-8、IL-6、IL-1β

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-21-003115.png)

IL1B, IL6, TNF 和几种趋化因子 (CCL2, CCL3, CCL4 and CCL7)在重症患者的巨噬细胞中高表达；CXCL9, CXCL10 and CXCL11在患者中表达量高于正常人；CXCL16（它的产物与CXCR6结合）在轻度患者中表达比重症患者高

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-21-004151.png)

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-21-003954.png)

总之，重症患者肺部的巨噬细胞可能通过CCR1和CXCR2招募炎症单核细胞和中性粒细胞，导致局部发炎；轻度患者的巨噬细胞通过CXCR3和CXCR6产生更多的T细胞趋化因子

## 5 意义与不足

说明了细胞素风暴与COVID-19的严重程度有关

> 细胞素风暴（Cytokine storm）：又称高细胞因子症（英语：Hypercytokinemia），一种不适当的免疫反应，因为细胞因子与免疫细胞间的正回馈回路而产生。这也被认为是1918年流感大流行、2003年SARS事件、2009年H1N1流感大流行，以及H5N1高致病性禽流感中病毒致死的原因 当免疫系统对抗病原体时，**细胞因子会引导免疫细胞前往受感染处**。同时，细胞因子也会激活这些免疫细胞，被激活的免疫细胞则会产生更多的细胞素。通常来说，人体会检查并控制这个反馈循环。但是在有些情况下，情况会失控，导致**一个地方聚集了太多被激活的免疫细胞**。

揭示了在COVID-19中潜在的免疫发病机制中巨噬细胞和T细胞异常反应

存在的不足：病人数量少，并存在异质性；缺少纵向比较（比如感染前后组织的收集测序）；B细胞的反应由于数量少没有进行分析；年龄及患者之前存在的问题没有全面考虑
