# 2.2.3 研究 | 2020-单细胞分析揭示葡萄膜黑色素瘤新的进化复杂性

> 看这篇的原因是看到它的方法部分写的很详细，提供了很多参数可以参考。但是CNV和免疫部分我研究不深，所以下面也不会介绍很详细

## 1 文章信息

题目：Single-cell analysis reveals new evolutionary complexity in uveal melanoma

发表日期：2020年1月24日

杂志：Nature Communications

文章在：<https://www.nature.com/articles/s41467-019-14256-1>

DOI：<https://doi.org/10.1038/s41467-019-14256-1>

附件在：<https://static-content.springer.com/esm/art%3A10.1038%2Fs41467-019-14256-1/MediaObjects/41467_2019_14256_MOESM1_ESM.pdf>

![图1](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-031821.png)

## 2 摘要

葡萄膜黑色素瘤（UM）是一种高度转移性癌症，与皮肤黑色素瘤不同，它对免疫检查点疗法无反应。

> 葡萄膜恶性黑色素瘤是成年人中最多见的一种恶性眼内肿瘤，在国外其发病率占眼内肿瘤的首位，在国内则仅次于视网膜母细胞瘤，居眼内肿瘤的第二位。此瘤的恶性程度高，眼后极部是好发部位。**易经经血流转移，85%转移至肝脏，预后较差。**

作者使用来自**8个原位癌和3个转移癌样本的59,915个肿瘤和非肿瘤细胞**进行单细胞测序，来检查肿瘤微环境。肿瘤细胞展示了新的亚克隆细胞基因组复杂性和转录状态。

> 肿瘤微环境是一个动态网络，它包括肿瘤细胞、细胞外基质和间质组织等，是影响肿瘤转移的关键因素

肿瘤浸润免疫细胞检测到了之前无法识别的多种细胞类型，包括主要表达LAG3（一种免疫检查点的marker）而非PD-1或CTLA-4的CD8 + T细胞。

> 免疫检查点是指免疫系统的内在调控机制，可保持自身耐受性，并有助于避免在生理性免疫应答期间的附带损伤 免疫检查点抑制剂的前世今生：<http://rehab.dxy.cn/article/503316>
>
> * CD4+ 或 CD8+ 的 T 细胞表面存在的一种免疫球蛋白，被称之为细胞毒性淋巴细胞抗原 4，亦称为CTLA-4。 CTLA-4 调节初始和记忆性 T 细胞的早期活化程度
> * 1992 年，日本学者 Ishida 从凋亡的小鼠 T 细胞杂交瘤 中发现了 PD-1。因其可令 T 细胞失活，将其命名为程序性死亡受体 1，亦称为PD-1。PD-1 主要限制慢性炎症、感染或癌症中的 T 细胞活性，从而限制自身免疫

V(D)J分析发现了克隆扩增的T细胞，表明它们能够发起免疫反应。

> Illumina的免疫学研究综述：<http://web.illumina.com.cn/landing/products_view.asp?newsid=155>
>
> B细胞和T细胞构成了免疫系统的适应性分支，并能够识别繁多的抗原。 与体细胞相比，B 细胞和 T 细胞是独特的，其发育和成熟是由生殖细胞系中未编码的 DNA 序列决定的。相反，在成熟过程中，这些细胞经历了**可变区（V）、多样区（D）和接合区（J）**&#x57FA;因片段的重排，以便形成独特的序列。

Class 1B UM的惰性肝转移被克隆扩增的浆细胞浸润，表明具有抗体介导的免疫

> UM分类参考：<https://www.myuvealmelanoma.com/health-care-professionals/decisiondx-um-summary/>
>
> * Class 1A: Very low risk, with a 2% chance of the eye cancer spreading over the next five years
> * Class 1B: Low risk, with a 21% chance of metastasis over five years;
> * Class 2: High risk, with 72% odds of metastasis within five years.

最后，对于高危UM患者，LAG3可能为新的免疫检查点抑制剂研究提供思路

## 3 方法

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-063543.png)

### **3.1 样本选择**

手术切除眼或肝后立即分离肿瘤区域的单细胞。转移性肿瘤组织特意从肿瘤-肝脏交界的远端选取，避免混入正常的肝脏组织。其余肿瘤组织样本则进行DecisionDx-UMseq的DNA和RNA分析

> DecisionDx-UM是一种预后测试，可准确判断与眼部黑色素瘤相关的转移风险 (<https://en.wikipedia.org/wiki/DecisionDx-UM>)

### **3.2 单细胞RNA测序**

总共11个样本，选择10X测序，样本编号与取样位点对应如图

![样本编号与取样位点对应如图](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-095108.png)

* UMM061, UMM062, UMM063, UMM064, UMM065, UMM066, UMM069, UMM067L, UMM041L以及BSSR0022样本使用三种文库制备方案：Chromium Single Cell 5’ Library & Gel Bead Kit v2、Chromium Single Cell V(D)J Human T Cell Enrichment Kit、Chromium Single Cell V(D)J Human B Cell Enrichment Kit。
* UMM059样本使用Chromium Single Cell 3′ Library & Gel Bead Kit v2文库制备。
* 5’端文库可以捕获10,000细胞，3‘端文库(UMM059样本)可捕获5,000细胞。每个样本使用独立的Chromium Single Cell A Chip。3‘和5’基因表达文库使用 NextSeq 500测序，B细胞和T细胞的VDJ文库使用MiSeq测序

> 关于10x Genomics 建库流程，可以看： <http://www.novogene.com/views/default/data/documents/10x_yk.pdf>

### **3.3 单细胞DNA测序**

UMM069 和 UMM041L样本使用Chromium Single Cell DNA Library & Gel Bead Kit + Chromium Single Cell C and D Chips进行文库制备，捕获500细胞。使用NextSeq 500测序

### **3.4 DecisionDx-UMseq的DNA和RNA分析**

肿瘤RNA样本用来看基因表达量，DNA用来找变异

> Harbour, J. W., Chen, R. The DecisionDx-UM gene expression profile test provides risk stratification and individualized patient care in uveal melanoma. PLoS Curr. 5 (2013).

## 4 数据分析

### **4.1 【重头戏】单细胞RNA分析**

**4.1.1 上游：**

使用CellRanger (version 2.1.1)，利用`mkfastq`从原始的BCL文件得到FASTQ，然后`count`定量【比对到GRCh38 Ensembl build 84 genome (version 1.2.0）】。

**4.1.2 下游：基于R 3.5环境**

读入数据：11个样本的数据利用**Seurat2.3.4** 的 `Read10X()`读入，利用`aggregate` 进行整合。接着进行数据过滤（**标准是：UMI大于400, 每个细胞包含100-8000个基因，线粒体含量小于10%**）。没有进行样本批次矫正，**结果得到了59,915个细胞**

归一、标准化：利用`LogNormalize`进行归一化，设置`scale factor = 10,000`，然后利用`Scale.Data()`进行标准化，指定`vars.to.regress`去除UMI和线粒体对差异的影响。

细胞周期分析：利用`CellCycleScoring()` 【来自：Tirosh, I. et al. Dissecting the multicellular ecosystem of metastatic melanoma by single-cell RNA-seq. Science 352, 189–196 (2016).】

找高变化基因：设定范围是normalized expression 介于0.125 和 3；quantile-normalized variance 大于0.5，找到1865个高变化基因

降维：PCA前20个主成分 + tSNE （利用`RunTSNE()`）

寻找Doublets（一个孔出现两个细胞）：`DoubletFinder V2.0.2`【来自：McGinnis, C. S., Murrow, L. M. & Gartner, Z. J. DoubletFinder: doublet detection in single-cell RNA sequencing data using artificial nearest neighbors. Cell Syst. 8, 329–337.e4 (2019).】发现除巨噬细胞或单核细胞以外，很少会出现doublets（<10%）

> 巨噬细胞 Macrophage：是一种位于组织内的白细胞，源自单核细胞 单核细胞 Monocyte：是人体免疫系统中的一种白细胞，单核细胞来源于骨髓中的前体细胞，在血管内为单核细胞，血管外就变成巨噬细胞 来自：<https://zh.wikipedia.org/wiki/%E5%B7%A8%E5%99%AC%E7%BB%86%E8%83%9E>
>
> 需要注意：两个细胞粘在一起这种Doublet现象，不一定是分析的假象。任何细胞都不是一个孤岛，在结核病和登革热发生时，单核细胞成为疾病的储存库，因此T细胞很有可能与单核细胞接触并形成doublet 来自：「在流式分析中排除doublet，我们可能做错了」<https://www.ebiotrade.com/newsf/2019-6/2019627161132438.htm>

细胞亚群：利用`FindClusters()` ，使用前20个主成分，`resolution=3`，得到58个cluster。【下图：a图按来源划分；b图是全部的cluster】

![a图按来源划分；b图是全部的cluster](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-064709.png)

然后用marker基因鉴定细胞类群：

* Tumor cells：*MLANA*, *MITF*, and *DCT*
* Tumor cell继续分：按照*PRAME* 和 gene expression profile (GEP)基因
* T Cells (*CD3D*, *CD3E*, *CD8A*)
* B cells (*CD19*, *CD79A*, *MS4A1* \[*CD20*])
* Plasma cells (*IGHG1*, *MZB1*, *SDC1*, *CD79A*)
* Monocytes and macrophages (*CD68*, *CD163*, *CD14*)
* NK Cells (*FGFBP2*, *FCG3RA*, *CX3CR1*)
* Retinal pigment epithelium (*RPE65*)
* Photoreceptor cells (*RCVRN*)
* Fibroblasts (*FGF7*)
* Endothelial cells (*PECAM1*, *VWF*)

![image-20200505145144203](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-065144.png)

免疫细胞分析：利用`SubsetData()` 最后得到了16470个免疫细胞，经过归一化、找高变化基因（4423个）、PCA、tSNE（resolution=10），得到74个cluster，再传给`AverageExpression()`计算每个cluster的平均RNA表达量

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-141256.png)

### **4.2 单细胞CNV分析**

利用Cellranger DNA (version 1.0.0)的`mkfastq`将BCL转为fastq，利用`cnv` 得到CNV数据（中间过程需要比对到GRCh37 build 87 genome），结果可视化利用Loupe scDNA Browser (version 1.0.0)。

过滤掉免疫浸润以及非肿瘤细胞：设定subtree depth

### **4.3 inferCNV和克隆性分析**

inferCNV：<https://github.com/broadinstitute/inferCNV>

* `inferCNV`用于分析体细胞大规模染色体拷贝数变化(copy number  alterations, CNA), 例如整条染色体或大片段染色体的增加或丢失(gain or deletions)。
* 原理：以一组"正常"细胞作为参考，分析肿瘤基因组上各个位置的基因表达量强度变化. 通过热图的形式展示每条染色体上的基因相对表达量
* 横坐标是各个基因在染色体的分布（染色体经过了排序），纵坐标是各个样本
* 表达量差异来源于肿瘤细胞的表达量减去正常细胞的表达量，红色部分表示这部分染色体区域的基因发生扩增，蓝色表示缺失

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-131024.png)

UPhyloplot2：[https://github.com/harbourlab/UPhyloplot2，绘制肿瘤系统进化树](https://github.com/harbourlab/UPhyloplot2%EF%BC%8C%E7%BB%98%E5%88%B6%E8%82%BF%E7%98%A4%E7%B3%BB%E7%BB%9F%E8%BF%9B%E5%8C%96%E6%A0%91)

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-125500.png)

### **4.4 SCENIC 分析**

利用pySCENIC对8598个高质量UM细胞归一化后的表达矩阵进行计算，用GRNboost2进行基因调控网络重建。使用了24453个cisTarget Human motif database v9 motifs (<https://resources.aertslab.org/cistarget/motif2tf/motifs-v9-nr.hgnc-m0.001-o0.0.tbl>)

### **4.5 Monocle 2分析**

使用7947个高质量UM细胞

选轨迹推断基因：用`dispersionTable()`计算每个基因在细胞中的表达量相对于平均表达量的差异

结果可视化：`plot_cell_trajectory()`, `plot_complex_cell_trajectory()`

### **4.6 免疫细胞V(D)J 分析**

每个B细胞和T细胞文库的BCL文件也是用cellranger分析，先是`mkfastq`得到fastq，然后`vdj`

pipeline：<https://support.10xgenomics.com/single-cell-vdj/software/pipelines/latest/using/vdj>

## 5 结果

### **5.1 单细胞RNA测序分析**

目的是探索单细胞水平的肿瘤微环境

对59915个细胞进行分群，发现既有肿瘤细胞又有非肿瘤细胞

从原位癌class1（左）到转移癌class2（右），细胞类型复杂度上升

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-121736.png)

另外用GEP clinical prognostic test 方法，看12个基因在细胞类群的表达，其中5个基因（EIF1B, HTR2B, ECM1, CDH1, and ROBO1）主要在肿瘤细胞表达，有一个（SATB1）主要在T细胞中表达，其余二者均有。表示GEP测试的准确性可能取决于从复杂的肿瘤微环境取样过程

> GEP clinical prognostic test : Harbour, J. W., Chen, R. The DecisionDx-UM gene expression profile test provides risk stratification and individualized patient care in uveal melanoma. PLoS Curr. 5 (2013)

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-122647.png)

### **5.2 转录轨迹分析**

目的是探索UM细胞的转录状态。

SCENIC的结果是： class2中富集到了肿瘤蛋白基因MYC、JUN，bHLH-PAS缺氧相关转录因子ARNT

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-132207.png)

然后monocle2拟时序分析，得到了16种状态，主要分成2支（class1 和class2）

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-132720.png)

class1的细胞主要在1-4、14-16状态，class2主要在5-13，表示UM的整体分子特征主要就体现在class1和class2中

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-133214.png)

然后又用branched expression analysis modeling (BEAM) 和层次聚类的方法得到cluster，并且鉴定在不同状态富集的基因

下图是其中一个样本的结果（每个样本都进行了同样的操作），a是定量拟时序，b是细胞状态拟时序，c是亚克隆的拟时序，d是4个基因（JUN, MITF, HLA-A, and MYC）表达量的拟时序【这4个基因分别对应4种不同状态：TNFA/NFKB, differentiation, HLA/immune, and MYC】，e是细胞周期拟时序

可以看到单个样本中，这些转录状态在亚克隆和各个细胞周期中都有分布

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-135311.png)

整合的结果如下：

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-133438.png)

### **5.3 免疫细胞V(D)J 分析**

肿瘤微环境中9441个免疫细胞，分群如下：

![image-20200505221037964](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-141038.png)e

每个免疫细胞cluster的平均RNA表达量：

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-141505.png)

每个肿瘤样本免疫细胞中各个亚型占比：T细胞在所有样本都有体现，包括CD8+ cytotoxic T细胞、CD8+ T effector memory细胞，大部分T细胞都是CD8+，少部分是CD4+（包括：follicular helper cells, FOXP3+ regulatory cells, naïve lymphocytes）

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-141611.png)

单细胞VDJ结果：克隆扩增T细胞只存在于3个样本中

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-141734.png)

CD8+ T cell expression of exhaustion-associated immune checkpoint molecules is strongest for LAG3, variable for TIGIT, and minimal for PDCD1 (PD1), CTLA4, HAVCR2 (TIM3), and TNFRSF9

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2020-05-05-144318.png)

## 6 意义

Class1 UM的潜伏期长和转移率低可能是由于免疫监视，而免疫监视可能是由EIF1AX和SF3B1突变产生的新抗原引起的。 这种可能性可能具有临床意义，值得进一步研究。

scRNA-seq V（D）J分析显示UM样品中克隆扩增的T细胞或浆细胞表明肿瘤浸润的免疫细胞能够引发反应，表明肿瘤突变程度低并不是UMs对检查点抑制剂反应差的唯一原因。

发现LAG3是UM中的主要衰竭指标，至少可以部分解释先前针对CTLA4和PD1的检查点抑制的失败。 LAG3是第三个针对患者的免疫抑制受体，表现出与PD1的显着协同作用，不仅在CD8 + T细胞上表达，而且在NK细胞和调节性T细胞上表达，并且具有独特的特性，可以显著扩大检查点抑制剂疗法的疗效。 因此，LAG3抑制剂正在多种癌症的大量临床试验中进行评估。
