单细胞交响乐
  • 前言:我与《单细胞交响乐》的缘分
  • 1 准备篇:背景知识
    • 1.1 数据结构
    • 1.2 总览 | 从实验到分析
  • 2 积累篇:文献阅读
    • 2.1.1 综述 | 2019-单细胞转录组分析最佳思路
    • 2.1.2 综述 | 2018-单细胞捕获平台
    • 2.1.3 综述 | 2017-scRNA中的细胞聚类分群
    • 2.1.4 综述 | scRNA已经开发出超过1000款工具了,你用过几种?
    • 2.1.5 综述 | 2021-单细胞测序的微流控技术应用
    • 2.2.1 研究 | 2018-单细胞转录组探索癌症免疫治疗获得性抗性机理
    • 2.2.2 研究 | 2018-人类结直肠癌单细胞多组学分析
    • 2.2.3 研究 | 2020-单细胞分析揭示葡萄膜黑色素瘤新的进化复杂性
    • 2.2.4 研究 | 2020-COVID-19病人支气管免疫细胞单细胞测序分析
    • 2.2.5 研究 | 2020-原汁原味读--单细胞肿瘤免疫图谱
    • 2.2.6 研究 | 2021-多发性骨髓瘤发展过程中肿瘤和免疫细胞的共同进化
    • 2.2.7 研究 | 2021-多个组织的成纤维细胞图谱
    • 2.2.8 研究 | 2021-多组学分析肺结核队列的记忆T细胞状态
    • 2.2.9 研究 | 2021-CancerSCEM: 人类癌症单细胞表达图谱数据库
    • 2.2.10 研究| 2021-单细胞转录组分析COVID-19重症患者肺泡巨噬细胞亚型
    • 2.2.11 研究 |2021-单细胞转录组揭示肺腺癌特有的肿瘤微环境
    • 2.2.12 研究 | 2021-单细胞转录组揭示乳头状甲状腺癌起始与发展
    • 2.2.13 研究 | 2021-解析食管鳞癌化疗病人的单细胞转录组
    • 2.2.14 研究 | 2021-单细胞水平看骨髓瘤的细胞状态和基因调控
    • 2.3.1 算法|2020-BatchBench比较scRNA批次矫正方法
    • 2.3.2 算法 | 2021-scPhere——用地球仪来展示降维结果
    • 2.3.3 算法 | 2021-单细胞差异分析方法评测
    • 2.3.4 算法 | 2021-细胞分群新方法——CNA(co-varying neighborhood analysis)
    • 2.3.5 工具 | 2018-iSEE:单细胞数据可视化辅助网页工具
    • 2.3.6 工具 | 2021-MACA: 一款自动注释细胞类型的工具
    • 2.3.7 工具 | 2021-一个很有想法的工具——Ikarus,想要在单细胞水平直接鉴定肿瘤细胞
  • 3 流程篇:分析框架
    • 3.1 质控
    • 3.2 归一化
    • 3.3 挑选表达量高变化基因
    • 3.4 降维
    • 3.5 聚类
    • 3.6 Marker/标记基因检测
    • 3.7 细胞类型注释
    • 3.8 批次效应处理
    • 3.9 多样本间差异分析
    • 3.10 检测Doublet
    • 3.11 细胞周期推断
    • 3.12 细胞轨迹推断
    • 3.13 与蛋白丰度信息结合
    • 3.14 处理大型数据
    • 3.15 不同R包数据的相互转换
  • 4 实战篇:活学活用
    • 4.1 实战一 | Smart-seq2 | 小鼠骨髓
    • 4.2 实战二 | STRT-Seq | 小鼠大脑
    • 4.3 实战三 | 10X | 未过滤的PBMC
    • 4.4 实战四 | 10X | 过滤后的PBMC
    • 4.5 实战五 | CEL-seq2 | 人胰腺细胞
    • 4.6 实战六 | CEL-seq | 人胰腺细胞
    • 4.7 实战七 | SMARTer | 人胰腺细胞
    • 4.8 实战八 | Smart-seq2 | 人胰腺细胞
    • 4.9 实战九 | 不同技术数据整合 | 人胰腺细胞
    • 4.10 实战十 | CEL-seq | 小鼠造血干细胞
    • 4.11 实战十一 | Smart-seq2 | 小鼠造血干细胞
    • 4.12 实战十二 | 10X | 小鼠嵌合体胚胎
    • 4.13 实战十三 | 10X | 小鼠乳腺上皮细胞
    • 4.14 | 实战十四 | 10X | HCA计划的38万骨髓细胞
  • 5 补充篇:开拓思路
    • 5.1 10X Genomics概述
      • 5.1.1 10X Genomics 问题集锦
    • 5.2 CellRanger篇
      • 5.2.1 CellRanger实战(一)数据下载
      • 5.2.2 CellRanger实战(二) 使用前注意事项
      • 5.2.3 CellRanger实战(三) 使用初探
      • 5.2.4 CellRanger实战(四)流程概览
      • 5.2.5 CellRanger实战(五) 理解count输出的结果
    • 5.3 Seurat的使用
      • 5.3.1 Seurat V3 | 实战之2700 PBMCs分析
      • 5.3.2 Seurat V3 | 如何改造Seurat包的DoHeatmap函数?
      • 5.3.3 scRNA的3大R包对比
      • 5.3.4 Seurat两种数据比较:integrated vs RNA assay
      • 5.3.5 seurat 的几种findmaker比较
    • 5.4 Monocle的使用
      • 5.4.1 Monocle V3实战
    • 5.5 多个数据集的整合
      • 5.5.1 使用Seurat的merge功能进行整合
      • 5.5.2 如何使用sctransform去除批次效应
由 GitBook 提供支持
在本页
  • 1 文章信息
  • 2 摘要
  • 3 方法
  • 3.1 样本选择
  • 3.2 单细胞RNA测序
  • 3.3 单细胞DNA测序
  • 3.4 DecisionDx-UMseq的DNA和RNA分析
  • 4 数据分析
  • 4.1 【重头戏】单细胞RNA分析
  • 4.2 单细胞CNV分析
  • 4.3 inferCNV和克隆性分析
  • 4.4 SCENIC 分析
  • 4.5 Monocle 2分析
  • 4.6 免疫细胞V(D)J 分析
  • 5 结果
  • 5.1 单细胞RNA测序分析
  • 5.2 转录轨迹分析
  • 5.3 免疫细胞V(D)J 分析
  • 6 意义

这有帮助吗?

  1. 2 积累篇:文献阅读

2.2.3 研究 | 2020-单细胞分析揭示葡萄膜黑色素瘤新的进化复杂性

刘小泽写于2020.5.5

上一页2.2.2 研究 | 2018-人类结直肠癌单细胞多组学分析下一页2.2.4 研究 | 2020-COVID-19病人支气管免疫细胞单细胞测序分析

最后更新于4年前

这有帮助吗?

看这篇的原因是看到它的方法部分写的很详细,提供了很多参数可以参考。但是CNV和免疫部分我研究不深,所以下面也不会介绍很详细

1 文章信息

题目:Single-cell analysis reveals new evolutionary complexity in uveal melanoma

发表日期:2020年1月24日

杂志:Nature Communications

文章在:

DOI:

附件在:

图1

2 摘要

葡萄膜黑色素瘤(UM)是一种高度转移性癌症,与皮肤黑色素瘤不同,它对免疫检查点疗法无反应。

葡萄膜恶性黑色素瘤是成年人中最多见的一种恶性眼内肿瘤,在国外其发病率占眼内肿瘤的首位,在国内则仅次于视网膜母细胞瘤,居眼内肿瘤的第二位。此瘤的恶性程度高,眼后极部是好发部位。易经经血流转移,85%转移至肝脏,预后较差。

作者使用来自8个原位癌和3个转移癌样本的59,915个肿瘤和非肿瘤细胞进行单细胞测序,来检查肿瘤微环境。肿瘤细胞展示了新的亚克隆细胞基因组复杂性和转录状态。

肿瘤微环境是一个动态网络,它包括肿瘤细胞、细胞外基质和间质组织等,是影响肿瘤转移的关键因素

肿瘤浸润免疫细胞检测到了之前无法识别的多种细胞类型,包括主要表达LAG3(一种免疫检查点的marker)而非PD-1或CTLA-4的CD8 + T细胞。

  • CD4+ 或 CD8+ 的 T 细胞表面存在的一种免疫球蛋白,被称之为细胞毒性淋巴细胞抗原 4,亦称为CTLA-4。 CTLA-4 调节初始和记忆性 T 细胞的早期活化程度

  • 1992 年,日本学者 Ishida 从凋亡的小鼠 T 细胞杂交瘤 中发现了 PD-1。因其可令 T 细胞失活,将其命名为程序性死亡受体 1,亦称为PD-1。PD-1 主要限制慢性炎症、感染或癌症中的 T 细胞活性,从而限制自身免疫

V(D)J分析发现了克隆扩增的T细胞,表明它们能够发起免疫反应。

B细胞和T细胞构成了免疫系统的适应性分支,并能够识别繁多的抗原。 与体细胞相比,B 细胞和 T 细胞是独特的,其发育和成熟是由生殖细胞系中未编码的 DNA 序列决定的。相反,在成熟过程中,这些细胞经历了可变区(V)、多样区(D)和接合区(J)基因片段的重排,以便形成独特的序列。

Class 1B UM的惰性肝转移被克隆扩增的浆细胞浸润,表明具有抗体介导的免疫

  • Class 1A: Very low risk, with a 2% chance of the eye cancer spreading over the next five years

  • Class 1B: Low risk, with a 21% chance of metastasis over five years;

  • Class 2: High risk, with 72% odds of metastasis within five years.

最后,对于高危UM患者,LAG3可能为新的免疫检查点抑制剂研究提供思路

3 方法

3.1 样本选择

手术切除眼或肝后立即分离肿瘤区域的单细胞。转移性肿瘤组织特意从肿瘤-肝脏交界的远端选取,避免混入正常的肝脏组织。其余肿瘤组织样本则进行DecisionDx-UMseq的DNA和RNA分析

3.2 单细胞RNA测序

总共11个样本,选择10X测序,样本编号与取样位点对应如图

  • UMM061, UMM062, UMM063, UMM064, UMM065, UMM066, UMM069, UMM067L, UMM041L以及BSSR0022样本使用三种文库制备方案:Chromium Single Cell 5’ Library & Gel Bead Kit v2、Chromium Single Cell V(D)J Human T Cell Enrichment Kit、Chromium Single Cell V(D)J Human B Cell Enrichment Kit。

  • UMM059样本使用Chromium Single Cell 3′ Library & Gel Bead Kit v2文库制备。

  • 5’端文库可以捕获10,000细胞,3‘端文库(UMM059样本)可捕获5,000细胞。每个样本使用独立的Chromium Single Cell A Chip。3‘和5’基因表达文库使用 NextSeq 500测序,B细胞和T细胞的VDJ文库使用MiSeq测序

3.3 单细胞DNA测序

UMM069 和 UMM041L样本使用Chromium Single Cell DNA Library & Gel Bead Kit + Chromium Single Cell C and D Chips进行文库制备,捕获500细胞。使用NextSeq 500测序

3.4 DecisionDx-UMseq的DNA和RNA分析

肿瘤RNA样本用来看基因表达量,DNA用来找变异

Harbour, J. W., Chen, R. The DecisionDx-UM gene expression profile test provides risk stratification and individualized patient care in uveal melanoma. PLoS Curr. 5 (2013).

4 数据分析

4.1 【重头戏】单细胞RNA分析

4.1.1 上游:

使用CellRanger (version 2.1.1),利用mkfastq从原始的BCL文件得到FASTQ,然后count定量【比对到GRCh38 Ensembl build 84 genome (version 1.2.0)】。

4.1.2 下游:基于R 3.5环境

读入数据:11个样本的数据利用Seurat2.3.4 的 Read10X()读入,利用aggregate 进行整合。接着进行数据过滤(标准是:UMI大于400, 每个细胞包含100-8000个基因,线粒体含量小于10%)。没有进行样本批次矫正,结果得到了59,915个细胞

归一、标准化:利用LogNormalize进行归一化,设置scale factor = 10,000,然后利用Scale.Data()进行标准化,指定vars.to.regress去除UMI和线粒体对差异的影响。

细胞周期分析:利用CellCycleScoring() 【来自:Tirosh, I. et al. Dissecting the multicellular ecosystem of metastatic melanoma by single-cell RNA-seq. Science 352, 189–196 (2016).】

找高变化基因:设定范围是normalized expression 介于0.125 和 3;quantile-normalized variance 大于0.5,找到1865个高变化基因

降维:PCA前20个主成分 + tSNE (利用RunTSNE())

寻找Doublets(一个孔出现两个细胞):DoubletFinder V2.0.2【来自:McGinnis, C. S., Murrow, L. M. & Gartner, Z. J. DoubletFinder: doublet detection in single-cell RNA sequencing data using artificial nearest neighbors. Cell Syst. 8, 329–337.e4 (2019).】发现除巨噬细胞或单核细胞以外,很少会出现doublets(<10%)

细胞亚群:利用FindClusters() ,使用前20个主成分,resolution=3,得到58个cluster。【下图:a图按来源划分;b图是全部的cluster】

然后用marker基因鉴定细胞类群:

  • Tumor cells:MLANA, MITF, and DCT

  • Tumor cell继续分:按照PRAME 和 gene expression profile (GEP)基因

  • T Cells (CD3D, CD3E, CD8A)

  • B cells (CD19, CD79A, MS4A1 [CD20])

  • Plasma cells (IGHG1, MZB1, SDC1, CD79A)

  • Monocytes and macrophages (CD68, CD163, CD14)

  • NK Cells (FGFBP2, FCG3RA, CX3CR1)

  • Retinal pigment epithelium (RPE65)

  • Photoreceptor cells (RCVRN)

  • Fibroblasts (FGF7)

  • Endothelial cells (PECAM1, VWF)

免疫细胞分析:利用SubsetData() 最后得到了16470个免疫细胞,经过归一化、找高变化基因(4423个)、PCA、tSNE(resolution=10),得到74个cluster,再传给AverageExpression()计算每个cluster的平均RNA表达量

4.2 单细胞CNV分析

利用Cellranger DNA (version 1.0.0)的mkfastq将BCL转为fastq,利用cnv 得到CNV数据(中间过程需要比对到GRCh37 build 87 genome),结果可视化利用Loupe scDNA Browser (version 1.0.0)。

过滤掉免疫浸润以及非肿瘤细胞:设定subtree depth

4.3 inferCNV和克隆性分析

  • inferCNV用于分析体细胞大规模染色体拷贝数变化(copy number alterations, CNA), 例如整条染色体或大片段染色体的增加或丢失(gain or deletions)。

  • 原理:以一组"正常"细胞作为参考,分析肿瘤基因组上各个位置的基因表达量强度变化. 通过热图的形式展示每条染色体上的基因相对表达量

  • 横坐标是各个基因在染色体的分布(染色体经过了排序),纵坐标是各个样本

  • 表达量差异来源于肿瘤细胞的表达量减去正常细胞的表达量,红色部分表示这部分染色体区域的基因发生扩增,蓝色表示缺失

4.4 SCENIC 分析

4.5 Monocle 2分析

使用7947个高质量UM细胞

选轨迹推断基因:用dispersionTable()计算每个基因在细胞中的表达量相对于平均表达量的差异

结果可视化:plot_cell_trajectory(), plot_complex_cell_trajectory()

4.6 免疫细胞V(D)J 分析

每个B细胞和T细胞文库的BCL文件也是用cellranger分析,先是mkfastq得到fastq,然后vdj

5 结果

5.1 单细胞RNA测序分析

目的是探索单细胞水平的肿瘤微环境

对59915个细胞进行分群,发现既有肿瘤细胞又有非肿瘤细胞

从原位癌class1(左)到转移癌class2(右),细胞类型复杂度上升

另外用GEP clinical prognostic test 方法,看12个基因在细胞类群的表达,其中5个基因(EIF1B, HTR2B, ECM1, CDH1, and ROBO1)主要在肿瘤细胞表达,有一个(SATB1)主要在T细胞中表达,其余二者均有。表示GEP测试的准确性可能取决于从复杂的肿瘤微环境取样过程

GEP clinical prognostic test : Harbour, J. W., Chen, R. The DecisionDx-UM gene expression profile test provides risk stratification and individualized patient care in uveal melanoma. PLoS Curr. 5 (2013)

5.2 转录轨迹分析

目的是探索UM细胞的转录状态。

SCENIC的结果是: class2中富集到了肿瘤蛋白基因MYC、JUN,bHLH-PAS缺氧相关转录因子ARNT

然后monocle2拟时序分析,得到了16种状态,主要分成2支(class1 和class2)

class1的细胞主要在1-4、14-16状态,class2主要在5-13,表示UM的整体分子特征主要就体现在class1和class2中

然后又用branched expression analysis modeling (BEAM) 和层次聚类的方法得到cluster,并且鉴定在不同状态富集的基因

下图是其中一个样本的结果(每个样本都进行了同样的操作),a是定量拟时序,b是细胞状态拟时序,c是亚克隆的拟时序,d是4个基因(JUN, MITF, HLA-A, and MYC)表达量的拟时序【这4个基因分别对应4种不同状态:TNFA/NFKB, differentiation, HLA/immune, and MYC】,e是细胞周期拟时序

可以看到单个样本中,这些转录状态在亚克隆和各个细胞周期中都有分布

整合的结果如下:

5.3 免疫细胞V(D)J 分析

肿瘤微环境中9441个免疫细胞,分群如下:

每个免疫细胞cluster的平均RNA表达量:

每个肿瘤样本免疫细胞中各个亚型占比:T细胞在所有样本都有体现,包括CD8+ cytotoxic T细胞、CD8+ T effector memory细胞,大部分T细胞都是CD8+,少部分是CD4+(包括:follicular helper cells, FOXP3+ regulatory cells, naïve lymphocytes)

单细胞VDJ结果:克隆扩增T细胞只存在于3个样本中

CD8+ T cell expression of exhaustion-associated immune checkpoint molecules is strongest for LAG3, variable for TIGIT, and minimal for PDCD1 (PD1), CTLA4, HAVCR2 (TIM3), and TNFRSF9

6 意义

Class1 UM的潜伏期长和转移率低可能是由于免疫监视,而免疫监视可能是由EIF1AX和SF3B1突变产生的新抗原引起的。 这种可能性可能具有临床意义,值得进一步研究。

scRNA-seq V(D)J分析显示UM样品中克隆扩增的T细胞或浆细胞表明肿瘤浸润的免疫细胞能够引发反应,表明肿瘤突变程度低并不是UMs对检查点抑制剂反应差的唯一原因。

发现LAG3是UM中的主要衰竭指标,至少可以部分解释先前针对CTLA4和PD1的检查点抑制的失败。 LAG3是第三个针对患者的免疫抑制受体,表现出与PD1的显着协同作用,不仅在CD8 + T细胞上表达,而且在NK细胞和调节性T细胞上表达,并且具有独特的特性,可以显著扩大检查点抑制剂疗法的疗效。 因此,LAG3抑制剂正在多种癌症的大量临床试验中进行评估。

免疫检查点是指免疫系统的内在调控机制,可保持自身耐受性,并有助于避免在生理性免疫应答期间的附带损伤 免疫检查点抑制剂的前世今生:

Illumina的免疫学研究综述:

UM分类参考:

DecisionDx-UM是一种预后测试,可准确判断与眼部黑色素瘤相关的转移风险 ()

样本编号与取样位点对应如图

关于10x Genomics 建库流程,可以看:

巨噬细胞 Macrophage:是一种位于组织内的白细胞,源自单核细胞 单核细胞 Monocyte:是人体免疫系统中的一种白细胞,单核细胞来源于骨髓中的前体细胞,在血管内为单核细胞,血管外就变成巨噬细胞 来自:

需要注意:两个细胞粘在一起这种Doublet现象,不一定是分析的假象。任何细胞都不是一个孤岛,在结核病和登革热发生时,单核细胞成为疾病的储存库,因此T细胞很有可能与单核细胞接触并形成doublet 来自:「在流式分析中排除doublet,我们可能做错了」

a图按来源划分;b图是全部的cluster
image-20200505145144203

inferCNV:

UPhyloplot2:

利用pySCENIC对8598个高质量UM细胞归一化后的表达矩阵进行计算,用GRNboost2进行基因调控网络重建。使用了24453个cisTarget Human motif database v9 motifs ()

pipeline:

e

http://rehab.dxy.cn/article/503316
http://web.illumina.com.cn/landing/products_view.asp?newsid=155
https://www.myuvealmelanoma.com/health-care-professionals/decisiondx-um-summary/
https://en.wikipedia.org/wiki/DecisionDx-UM
http://www.novogene.com/views/default/data/documents/10x_yk.pdf
https://zh.wikipedia.org/wiki/%E5%B7%A8%E5%99%AC%E7%BB%86%E8%83%9E
https://www.ebiotrade.com/newsf/2019-6/2019627161132438.htm
https://github.com/broadinstitute/inferCNV
https://github.com/harbourlab/UPhyloplot2,绘制肿瘤系统进化树
https://resources.aertslab.org/cistarget/motif2tf/motifs-v9-nr.hgnc-m0.001-o0.0.tbl
https://support.10xgenomics.com/single-cell-vdj/software/pipelines/latest/using/vdj
https://www.nature.com/articles/s41467-019-14256-1
https://doi.org/10.1038/s41467-019-14256-1
https://static-content.springer.com/esm/art%3A10.1038%2Fs41467-019-14256-1/MediaObjects/41467_2019_14256_MOESM1_ESM.pdf
image-20200505221037964