# 2.1.2 综述 | 2018-单细胞捕获平台

> 每一次的测序技术变革都推动了检测灵敏度和通量，那么就来看看单细胞领域各种捕获技术的更迭 \
> 2018  [Platforms for Single-Cell Collection and Analysis](https://www.mdpi.com/1422-0067/19/3/807/pdf)

### 摘要

对单个细胞的分离最基本要求就是：保证捕获的质量。如果用三个词语概况就是：**fast、effective、gentle**

**传统的分离方法**是：显微操作（micromanipulation）、激光显微切割（laser capture microdissection）、荧光激活细胞分选仪（fluorescence-activated cell sorting，FACS）。过去的十年许多高效的新方法开发出来，它们不仅仅是作为传统方法的备选，更有望取代传统方法。

**新方法**基于微流控芯片、液滴、微孔板，并且利用毛细管、磁吸、电场等实现了细胞自动化收集。这篇综述总结了现有的方法和市场上的平台以及它们的发展。

### 1 前言

单细胞技术可以帮助检测细胞异质性、展示细胞对不同理化性质的复杂反应。另外还能鉴定罕见细胞群体，如：循环肿瘤细胞（circulating tumor cells， CTCs，它是存在于外周血中的各类肿瘤细胞的统称）、与治疗或疾病相关的残留细胞、干细胞等。生命系统的复杂性要求我们要在各个层次进行基因调控研究，包括DNA、mRNA的转录、不同的调控RNA（例如microRNA和一些non-coding RNA）、蛋白、细胞代谢、激素水平等，而且每个水平都有各自的分析手段，于是后来产生了针对**单个细胞的多层面分析手段**，最常用的就是针对核苷酸的qPCR、RNA/DNA-Seq，针对蛋白的免疫组化（immunohistochemistry，IHC）、定量质谱（quantitative mass spectroscopy, MS），其中RNA-seq就是目前曝光率最高的，因为它增加通量的同时降低了费用。

要做这些分析，首先关心的就是如何在保证最少干扰细胞原始表达量的同时，将细胞收集起来。这些年发展起来的方法、仪器都有各自的优缺点（考虑到**时间、通量、价格、空间分辨率等**），还有持续开发的（如：Stilla Technologies公司的**ddPCR技术--digital droplet PCR-based**）。因此本文着重将每个新方法的初衷、特性和潜在应用整合起来做了一个综述。

### 2 分离细胞的初衷—在混杂群体中找到自己想要的

选择特定类型的细胞经常是根据荧光标记，它包括两种方式：一种是直接使用**荧光抗体**；另一种是用**转荧光基因的蛋白**，会发出红、黄、绿颜色，而且只在目标细胞群体中表达。

第一种利用抗体的方法缺点就在于：抗体数量有限（尤其是对研究不多的物种）、在不同细胞群体中可能有交叉反应、背景标记模糊；

第二种方法虽然解决了第一种方法的一些问题，但是找这个合适的特异的marker基因比较困难，尤其是在一些病理条件下，细胞表达量骤增，可能这个marker也会在其他细胞类型中检测到。

这两种都不合适就要利用最粗暴的观察手段，依据大小、形状、在组织中的位置等特征

### 3 收集细胞的传统手段

主要有三种：显微操作、荧光激活细胞分选（FACS）、激光纤维切割捕获（LCM），这三种方式都有成熟、标准化的流程。前两种可以在体外或脱离组织条件下分离细胞，LCM需要将细胞或组织固定（因此大多会导致细胞死亡，不过现在也有利用LCM分析活细胞的例子）。另外这三种方法的**通量**也是不同的，FACS分选细胞非常高效，短时间内就能分选上千细胞；显微操作和LCM方法就非常慢，通量也低。

因为**前两种方法需要组织裂解**，所以基因的表达可能会受到影响，影响因素也有很多，例如：裂解方法、组织类型、试剂浓度、孵育时间、温度等等，LCM方法因为是直接将RNA固定住，因此它会受这些外部因素影响小一些。不过LCM使用的固定试剂（例如福尔马林）会使RNA产生降解，虽然现在有了不含福尔马林的固定剂，但RNA的质量还是会受到影响。

**LCM方法最大的一个优势就是它能记录空间信息**，其他两种因为做了组织裂解，所以得到的细胞不知道原来在组织的什么位置；另外一个优点就是残余的组织可以保存留用。不过这个方法需要技术的辅助，既然是切割，那么就存在混进不相关细胞的可能。细胞污染这个问题在显微操作中也会存在，不过它混进来的可能是一点溶剂。既然可能存在“混杂”的问题，那么**设置阴性对照**就显得很有必要。

这三种方法的具体对比如下图：

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2019-08-13-071927.png)

分离得到细胞后，一般会收集到裂解缓冲液中，准备后续的scRNA的寡核苷酸barcode结合或质谱技术的镧系元素barcode结合。目前的趋势是将细胞收集和后续反应整合在一个设备中（就像10X的设备），实现end-to-end solution。

### 4 收集细胞的现代手段

> 变革进化

**仪器公司的不断进步**

首先是高通量市场：

Illumina+BioRad生产的ddSEQ Single-Cell Isolator为不同起始细胞数提供了定制的试剂盒；

10X推出的Chromium可以在一个仪器中进行各种分析（基因组、外显子、转录组、免疫相关）；

BD Rhapsody可以定制化panel，实现靶标DNA/RNA测序；

Nadia Innovate可以实现单细胞收集参数的完全控制；

然后是低通量市场：

C1：新的C1 Fluidigm芯片能实现800个细胞的测序，实现从细胞捕获到结果报告的流程

ICELL8：可以分析大量的细胞，同时又可以可视化控制、挑选部分细胞进行下游分析

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2019-08-13-072745.png)

**高通量仪器**

大多数仪器都配置了微流控的“lab-on-chip”技术，能产生数百万的定制的液滴，其中会包含单个细胞、寡核苷酸（例如用：anchored oligo-dT，目的是捕获mRNA）、反转录试剂（产生cDNA），然后整个文库制备一般会在gel beads中进行（例如10X）；另外液滴也可以单纯作为捕获容器，后续的反应及文库制备会在magnetic beads中进行（例如BD）。这种建库测序的技术发展出了：**Drop-seq、inDrop-Seq、SCRB-Seq**或者公司自己设计的方案。以上的几种方法都是基于poly-A富集mRNA的，因此它们属于**3'端建库**。

为了将建库测序得到的reads成功回溯到某个细胞，就要在寡核苷酸上“做手脚”。每个细胞分配了一段特定的序列，叫做barcode。来自一个细胞的reads都共享同样的**barcode**。另外还有一种情况，就是Illumina短序列测序需要扩增，扩增后才能根据cluster（也就是簇，一簇的reads都相同）来增加测序的准确性。当然也就是在PCR这一步，可能会引入偏差（来源：不同的扩增模板的扩增效率不同，从而影响原始的数量比例）。对单细胞来讲，它和bulk 转录组不同，本来reads数量就不多，如果再加上PCR bias的影响，噪音就太大了。于是引入了**UMI（unique molecular identifiers，这个molecular就是指cDNA）**，每个初始cDNA分配一个独特的UMI。如果扩增完发现，有两个reads都属于同一个cDNA molecule，它们的UMI就是一样的，最后定量只会被计数一次

> 个人思考：PCR也不是十全十美，复制的结果就百分百和初始一样，也会有错误率。同一批cDNA扩增的结果也有可能差几个碱基，那么来自同一个cDNA的两条reads的UMI可能就不一样，差一两个碱基是可能的，因此后续计算的时候，可能会设置一个容错值（可能需要结合UMItools说明书看一下），就是说如果来自同一个cDNA的两条reads结果UMI之差1个碱基其余都一样，那么可能也会判断它们是来自同一个cDNA的

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2019-08-13-083853.png)

**尽管基于液滴的技术很先进，但是也有局限。**&#x6700;主要的缺点就是RNA捕获效率低，反转录施展不开（因为反转录过程只是发生在非常小的液滴空间中）、液滴很脆弱（泄露有风险），另外当起始细胞数量有限时，细胞捕获效率低。但同时如果起始细胞数量太多，又容易导致douplets现象（一个液滴中包含两个细胞），而且容易堵塞微流控芯片。因此，其他厂商探索了一些方法，**利用细胞板（其中包含了成千上万个微孔）**&#x6355;获大量细胞，并且每个微孔中也是放入了一个连接寡核苷酸的bead。之后的下游操作和基于液滴的方法就相似了。

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2019-08-13-085550.png)

> 下面👇分别来看一下

**4.1 Chromium System（10X）**

Chromium Single Cell 3′ Solution于**2016年10月**发布，亮点在于可以测几百乃至几万细胞，数量区间很大。利用了GemCode技术产生barcode。大体流程：

gel bead包含了barcode、UMI、反转录试剂 + 油滴中的细胞 =》 液滴（所谓的“油包水”）=》 这其中进行了细胞裂解、反转录反应，合成了cDNA =》 每个液滴混合在一起、然后溶解 =》 就构建好了cDNA文库

这个技术的细胞捕获率能到**65%**，双细胞率也很低，而且每次试剂更新都会降低这个比例，增加检测转录本的和数量。样本是在微流控芯片中进行处理的，**每个芯片10-20分钟可以处理8个样本**，产生100-80000个细胞。

**4.2 Rhapsody Single-Cell Analysis System （BD）**

2017年九月发布，它是Resolve平台的升级版，它是目前市场上**仅有的不依赖于液滴技术的高通量建库平台**。它的机器包含了一块布满20万微孔的板子，其中放了**UMI-barcoded 磁珠**，最多可以捕获2万个细胞。捕获的细胞裂解，然后mRNA附着在beads上。这些beads混合起来，然后在单个管中建库。当然，系统会在细胞裂解前进行扫描，统计捕获细胞数量、双细胞数量、空孔数量，帮助用户**自主选择多少beads进行建库**，样本的质量能不能满足后续要求。至于剩下的beads，可以留着后续使用，这样可以节省后续的费用。另外它**使用了targeted RNA-Seq的方法，也就是只会扩增感兴趣的转录本** 。

**4.3 C1 System and Polaris (Fluidigm)**

**C1可以说是现代单细胞领域的开拓者**，它于2012年发布，是第一个处理单细胞组学分析的仪器。它的操作主要在integrated fluidic circuit (IFC 芯片)上完成，每次可以处理96个细胞。目前至少有100篇文献使用这个技术，涵盖了转录组、全基因组、外显子、靶标DNA测序、表观、miRNA表达。这个平台的拓展性很强，可以使用不同的芯片（如：C1 Single-Cell Open App IFC chip）和自定义的实验方案（C1 Script Builder）；

另外这个公司2015年开发的一款叫Polaris平台，是第一个也是唯一一个 unique unified workflow for active cell selection, cultivation, and molecular analysis (up to 48 cells per run)

**4.4 Nadia and RNA-Seq System （Dolomite Bio）**

这家公司是2016年成立的，在2017年11月推出了Nadia的单细胞测序平台（也是利用Drop-seq的全自动平台）。它也是将单个细胞包裹在一个微珠（bead）中，微珠的表面富含捕获寡核苷酸和UMI。 **和上一个gel bead方案不同的是：** **这个液滴中不含有反转录试剂**。反转录过程是发生在微珠收集并破裂以后。这样做的好处就是：它不用受限于在皮微级别的微珠内进行，可以在外边大展拳脚。但话说回来，**它比gel bead的细胞捕获效率要低。**

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2019-08-13-094608.png)

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2019-08-13-094621.png)

#### 结论

* 细胞富集技术（如FACS）和高通量单细胞仪器整合起来是一个趋势，这样可以避免测一大批细胞，最后仅仅用了一小部分，造成各方面的浪费。这样整合起来可以有的放矢，我们可以仅仅选择感兴趣的细胞，然后高通量测序
* 一大挑战就是细胞质量的控制，目前没有评估单个细胞质量的工具。当然是可以根据bulk 转录组结果的表达量来定一个阈值，对每个细胞进行鉴定，比如看每个细胞中最少表达的基因数量。但不论怎样，这些方法都是后续的检验，我们的样本已经被处理完了，最优解还是测序之前就保证细胞的质量
* 多个组学联合分析是前景（ DNA, mRNA, regulatory RNA, proteins, metabolites），像10X就抓住了这个机会，好像BD也推出了Rhapsody蛋白检测的功能
* 最后就是针对分析工具整合的期待，还没有一个公认的分析流程出来，只有推广度高低之分，比如Seurat、Scater、Monocle这几个R包就推得比较多，那么说不定未来的标准流程就是它们
