2.2.3 研究 | 2020-单细胞分析揭示葡萄膜黑色素瘤新的进化复杂性
刘小泽写于2020.5.5
最后更新于
刘小泽写于2020.5.5
最后更新于
看这篇的原因是看到它的方法部分写的很详细,提供了很多参数可以参考。但是CNV和免疫部分我研究不深,所以下面也不会介绍很详细
题目:Single-cell analysis reveals new evolutionary complexity in uveal melanoma
发表日期:2020年1月24日
杂志:Nature Communications
文章在:https://www.nature.com/articles/s41467-019-14256-1
DOI:https://doi.org/10.1038/s41467-019-14256-1
葡萄膜黑色素瘤(UM)是一种高度转移性癌症,与皮肤黑色素瘤不同,它对免疫检查点疗法无反应。
葡萄膜恶性黑色素瘤是成年人中最多见的一种恶性眼内肿瘤,在国外其发病率占眼内肿瘤的首位,在国内则仅次于视网膜母细胞瘤,居眼内肿瘤的第二位。此瘤的恶性程度高,眼后极部是好发部位。易经经血流转移,85%转移至肝脏,预后较差。
作者使用来自8个原位癌和3个转移癌样本的59,915个肿瘤和非肿瘤细胞进行单细胞测序,来检查肿瘤微环境。肿瘤细胞展示了新的亚克隆细胞基因组复杂性和转录状态。
肿瘤微环境是一个动态网络,它包括肿瘤细胞、细胞外基质和间质组织等,是影响肿瘤转移的关键因素
肿瘤浸润免疫细胞检测到了之前无法识别的多种细胞类型,包括主要表达LAG3(一种免疫检查点的marker)而非PD-1或CTLA-4的CD8 + T细胞。
免疫检查点是指免疫系统的内在调控机制,可保持自身耐受性,并有助于避免在生理性免疫应答期间的附带损伤 免疫检查点抑制剂的前世今生:http://rehab.dxy.cn/article/503316
CD4+ 或 CD8+ 的 T 细胞表面存在的一种免疫球蛋白,被称之为细胞毒性淋巴细胞抗原 4,亦称为CTLA-4。 CTLA-4 调节初始和记忆性 T 细胞的早期活化程度
1992 年,日本学者 Ishida 从凋亡的小鼠 T 细胞杂交瘤 中发现了 PD-1。因其可令 T 细胞失活,将其命名为程序性死亡受体 1,亦称为PD-1。PD-1 主要限制慢性炎症、感染或癌症中的 T 细胞活性,从而限制自身免疫
V(D)J分析发现了克隆扩增的T细胞,表明它们能够发起免疫反应。
Illumina的免疫学研究综述:http://web.illumina.com.cn/landing/products_view.asp?newsid=155
B细胞和T细胞构成了免疫系统的适应性分支,并能够识别繁多的抗原。 与体细胞相比,B 细胞和 T 细胞是独特的,其发育和成熟是由生殖细胞系中未编码的 DNA 序列决定的。相反,在成熟过程中,这些细胞经历了可变区(V)、多样区(D)和接合区(J)基因片段的重排,以便形成独特的序列。
Class 1B UM的惰性肝转移被克隆扩增的浆细胞浸润,表明具有抗体介导的免疫
UM分类参考:https://www.myuvealmelanoma.com/health-care-professionals/decisiondx-um-summary/
Class 1A: Very low risk, with a 2% chance of the eye cancer spreading over the next five years
Class 1B: Low risk, with a 21% chance of metastasis over five years;
Class 2: High risk, with 72% odds of metastasis within five years.
最后,对于高危UM患者,LAG3可能为新的免疫检查点抑制剂研究提供思路
手术切除眼或肝后立即分离肿瘤区域的单细胞。转移性肿瘤组织特意从肿瘤-肝脏交界的远端选取,避免混入正常的肝脏组织。其余肿瘤组织样本则进行DecisionDx-UMseq的DNA和RNA分析
DecisionDx-UM是一种预后测试,可准确判断与眼部黑色素瘤相关的转移风险 (https://en.wikipedia.org/wiki/DecisionDx-UM)
总共11个样本,选择10X测序,样本编号与取样位点对应如图
UMM061, UMM062, UMM063, UMM064, UMM065, UMM066, UMM069, UMM067L, UMM041L以及BSSR0022样本使用三种文库制备方案:Chromium Single Cell 5’ Library & Gel Bead Kit v2、Chromium Single Cell V(D)J Human T Cell Enrichment Kit、Chromium Single Cell V(D)J Human B Cell Enrichment Kit。
UMM059样本使用Chromium Single Cell 3′ Library & Gel Bead Kit v2文库制备。
5’端文库可以捕获10,000细胞,3‘端文库(UMM059样本)可捕获5,000细胞。每个样本使用独立的Chromium Single Cell A Chip。3‘和5’基因表达文库使用 NextSeq 500测序,B细胞和T细胞的VDJ文库使用MiSeq测序
关于10x Genomics 建库流程,可以看: http://www.novogene.com/views/default/data/documents/10x_yk.pdf
UMM069 和 UMM041L样本使用Chromium Single Cell DNA Library & Gel Bead Kit + Chromium Single Cell C and D Chips进行文库制备,捕获500细胞。使用NextSeq 500测序
肿瘤RNA样本用来看基因表达量,DNA用来找变异
Harbour, J. W., Chen, R. The DecisionDx-UM gene expression profile test provides risk stratification and individualized patient care in uveal melanoma. PLoS Curr. 5 (2013).
4.1.1 上游:
使用CellRanger (version 2.1.1),利用mkfastq
从原始的BCL文件得到FASTQ,然后count
定量【比对到GRCh38 Ensembl build 84 genome (version 1.2.0)】。
4.1.2 下游:基于R 3.5环境
读入数据:11个样本的数据利用Seurat2.3.4 的 Read10X()
读入,利用aggregate
进行整合。接着进行数据过滤(标准是:UMI大于400, 每个细胞包含100-8000个基因,线粒体含量小于10%)。没有进行样本批次矫正,结果得到了59,915个细胞
归一、标准化:利用LogNormalize
进行归一化,设置scale factor = 10,000
,然后利用Scale.Data()
进行标准化,指定vars.to.regress
去除UMI和线粒体对差异的影响。
细胞周期分析:利用CellCycleScoring()
【来自:Tirosh, I. et al. Dissecting the multicellular ecosystem of metastatic melanoma by single-cell RNA-seq. Science 352, 189–196 (2016).】
找高变化基因:设定范围是normalized expression 介于0.125 和 3;quantile-normalized variance 大于0.5,找到1865个高变化基因
降维:PCA前20个主成分 + tSNE (利用RunTSNE()
)
寻找Doublets(一个孔出现两个细胞):DoubletFinder V2.0.2
【来自:McGinnis, C. S., Murrow, L. M. & Gartner, Z. J. DoubletFinder: doublet detection in single-cell RNA sequencing data using artificial nearest neighbors. Cell Syst. 8, 329–337.e4 (2019).】发现除巨噬细胞或单核细胞以外,很少会出现doublets(<10%)
巨噬细胞 Macrophage:是一种位于组织内的白细胞,源自单核细胞 单核细胞 Monocyte:是人体免疫系统中的一种白细胞,单核细胞来源于骨髓中的前体细胞,在血管内为单核细胞,血管外就变成巨噬细胞 来自:https://zh.wikipedia.org/wiki/%E5%B7%A8%E5%99%AC%E7%BB%86%E8%83%9E
需要注意:两个细胞粘在一起这种Doublet现象,不一定是分析的假象。任何细胞都不是一个孤岛,在结核病和登革热发生时,单核细胞成为疾病的储存库,因此T细胞很有可能与单核细胞接触并形成doublet 来自:「在流式分析中排除doublet,我们可能做错了」https://www.ebiotrade.com/newsf/2019-6/2019627161132438.htm
细胞亚群:利用FindClusters()
,使用前20个主成分,resolution=3
,得到58个cluster。【下图:a图按来源划分;b图是全部的cluster】
然后用marker基因鉴定细胞类群:
Tumor cells:MLANA, MITF, and DCT
Tumor cell继续分:按照PRAME 和 gene expression profile (GEP)基因
T Cells (CD3D, CD3E, CD8A)
B cells (CD19, CD79A, MS4A1 [CD20])
Plasma cells (IGHG1, MZB1, SDC1, CD79A)
Monocytes and macrophages (CD68, CD163, CD14)
NK Cells (FGFBP2, FCG3RA, CX3CR1)
Retinal pigment epithelium (RPE65)
Photoreceptor cells (RCVRN)
Fibroblasts (FGF7)
Endothelial cells (PECAM1, VWF)
免疫细胞分析:利用SubsetData()
最后得到了16470个免疫细胞,经过归一化、找高变化基因(4423个)、PCA、tSNE(resolution=10),得到74个cluster,再传给AverageExpression()
计算每个cluster的平均RNA表达量
利用Cellranger DNA (version 1.0.0)的mkfastq
将BCL转为fastq,利用cnv
得到CNV数据(中间过程需要比对到GRCh37 build 87 genome),结果可视化利用Loupe scDNA Browser (version 1.0.0)。
过滤掉免疫浸润以及非肿瘤细胞:设定subtree depth
inferCNV:https://github.com/broadinstitute/inferCNV
inferCNV
用于分析体细胞大规模染色体拷贝数变化(copy number alterations, CNA), 例如整条染色体或大片段染色体的增加或丢失(gain or deletions)。
原理:以一组"正常"细胞作为参考,分析肿瘤基因组上各个位置的基因表达量强度变化. 通过热图的形式展示每条染色体上的基因相对表达量
横坐标是各个基因在染色体的分布(染色体经过了排序),纵坐标是各个样本
表达量差异来源于肿瘤细胞的表达量减去正常细胞的表达量,红色部分表示这部分染色体区域的基因发生扩增,蓝色表示缺失
UPhyloplot2:https://github.com/harbourlab/UPhyloplot2,绘制肿瘤系统进化树
利用pySCENIC对8598个高质量UM细胞归一化后的表达矩阵进行计算,用GRNboost2进行基因调控网络重建。使用了24453个cisTarget Human motif database v9 motifs (https://resources.aertslab.org/cistarget/motif2tf/motifs-v9-nr.hgnc-m0.001-o0.0.tbl)
使用7947个高质量UM细胞
选轨迹推断基因:用dispersionTable()
计算每个基因在细胞中的表达量相对于平均表达量的差异
结果可视化:plot_cell_trajectory()
, plot_complex_cell_trajectory()
每个B细胞和T细胞文库的BCL文件也是用cellranger分析,先是mkfastq
得到fastq,然后vdj
pipeline:https://support.10xgenomics.com/single-cell-vdj/software/pipelines/latest/using/vdj
目的是探索单细胞水平的肿瘤微环境
对59915个细胞进行分群,发现既有肿瘤细胞又有非肿瘤细胞
从原位癌class1(左)到转移癌class2(右),细胞类型复杂度上升
另外用GEP clinical prognostic test 方法,看12个基因在细胞类群的表达,其中5个基因(EIF1B, HTR2B, ECM1, CDH1, and ROBO1)主要在肿瘤细胞表达,有一个(SATB1)主要在T细胞中表达,其余二者均有。表示GEP测试的准确性可能取决于从复杂的肿瘤微环境取样过程
GEP clinical prognostic test : Harbour, J. W., Chen, R. The DecisionDx-UM gene expression profile test provides risk stratification and individualized patient care in uveal melanoma. PLoS Curr. 5 (2013)
目的是探索UM细胞的转录状态。
SCENIC的结果是: class2中富集到了肿瘤蛋白基因MYC、JUN,bHLH-PAS缺氧相关转录因子ARNT
然后monocle2拟时序分析,得到了16种状态,主要分成2支(class1 和class2)
class1的细胞主要在1-4、14-16状态,class2主要在5-13,表示UM的整体分子特征主要就体现在class1和class2中
然后又用branched expression analysis modeling (BEAM) 和层次聚类的方法得到cluster,并且鉴定在不同状态富集的基因
下图是其中一个样本的结果(每个样本都进行了同样的操作),a是定量拟时序,b是细胞状态拟时序,c是亚克隆的拟时序,d是4个基因(JUN, MITF, HLA-A, and MYC)表达量的拟时序【这4个基因分别对应4种不同状态:TNFA/NFKB, differentiation, HLA/immune, and MYC】,e是细胞周期拟时序
可以看到单个样本中,这些转录状态在亚克隆和各个细胞周期中都有分布
整合的结果如下:
肿瘤微环境中9441个免疫细胞,分群如下:
每个免疫细胞cluster的平均RNA表达量:
每个肿瘤样本免疫细胞中各个亚型占比:T细胞在所有样本都有体现,包括CD8+ cytotoxic T细胞、CD8+ T effector memory细胞,大部分T细胞都是CD8+,少部分是CD4+(包括:follicular helper cells, FOXP3+ regulatory cells, naïve lymphocytes)
单细胞VDJ结果:克隆扩增T细胞只存在于3个样本中
CD8+ T cell expression of exhaustion-associated immune checkpoint molecules is strongest for LAG3, variable for TIGIT, and minimal for PDCD1 (PD1), CTLA4, HAVCR2 (TIM3), and TNFRSF9
Class1 UM的潜伏期长和转移率低可能是由于免疫监视,而免疫监视可能是由EIF1AX和SF3B1突变产生的新抗原引起的。 这种可能性可能具有临床意义,值得进一步研究。
scRNA-seq V(D)J分析显示UM样品中克隆扩增的T细胞或浆细胞表明肿瘤浸润的免疫细胞能够引发反应,表明肿瘤突变程度低并不是UMs对检查点抑制剂反应差的唯一原因。
发现LAG3是UM中的主要衰竭指标,至少可以部分解释先前针对CTLA4和PD1的检查点抑制的失败。 LAG3是第三个针对患者的免疫抑制受体,表现出与PD1的显着协同作用,不仅在CD8 + T细胞上表达,而且在NK细胞和调节性T细胞上表达,并且具有独特的特性,可以显著扩大检查点抑制剂疗法的疗效。 因此,LAG3抑制剂正在多种癌症的大量临床试验中进行评估。
e