2.1.2 综述 | 2018-单细胞捕获平台
刘小泽写于19.8.13
每一次的测序技术变革都推动了检测灵敏度和通量,那么就来看看单细胞领域各种捕获技术的更迭 2018 Platforms for Single-Cell Collection and Analysis
摘要
对单个细胞的分离最基本要求就是:保证捕获的质量。如果用三个词语概况就是:fast、effective、gentle
传统的分离方法是:显微操作(micromanipulation)、激光显微切割(laser capture microdissection)、荧光激活细胞分选仪(fluorescence-activated cell sorting,FACS)。过去的十年许多高效的新方法开发出来,它们不仅仅是作为传统方法的备选,更有望取代传统方法。
新方法基于微流控芯片、液滴、微孔板,并且利用毛细管、磁吸、电场等实现了细胞自动化收集。这篇综述总结了现有的方法和市场上的平台以及它们的发展。
1 前言
单细胞技术可以帮助检测细胞异质性、展示细胞对不同理化性质的复杂反应。另外还能鉴定罕见细胞群体,如:循环肿瘤细胞(circulating tumor cells, CTCs,它是存在于外周血中的各类肿瘤细胞的统称)、与治疗或疾病相关的残留细胞、干细胞等。生命系统的复杂性要求我们要在各个层次进行基因调控研究,包括DNA、mRNA的转录、不同的调控RNA(例如microRNA和一些non-coding RNA)、蛋白、细胞代谢、激素水平等,而且每个水平都有各自的分析手段,于是后来产生了针对单个细胞的多层面分析手段,最常用的就是针对核苷酸的qPCR、RNA/DNA-Seq,针对蛋白的免疫组化(immunohistochemistry,IHC)、定量质谱(quantitative mass spectroscopy, MS),其中RNA-seq就是目前曝光率最高的,因为它增加通量的同时降低了费用。
要做这些分析,首先关心的就是如何在保证最少干扰细胞原始表达量的同时,将细胞收集起来。这些年发展起来的方法、仪器都有各自的优缺点(考虑到时间、通量、价格、空间分辨率等),还有持续开发的(如:Stilla Technologies公司的ddPCR技术--digital droplet PCR-based)。因此本文着重将每个新方法的初衷、特性和潜在应用整合起来做了一个综述。
2 分离细胞的初衷—在混杂群体中找到自己想要的
选择特定类型的细胞经常是根据荧光标记,它包括两种方式:一种是直接使用荧光抗体;另一种是用转荧光基因的蛋白,会发出红、黄、绿颜色,而且只在目标细胞群体中表达。
第一种利用抗体的方法缺点就在于:抗体数量有限(尤其是对研究不多的物种)、在不同细胞群体中可能有交叉反应、背景标记模糊;
第二种方法虽然解决了第一种方法的一些问题,但是找这个合适的特异的marker基因比较困难,尤其是在一些病理条件下,细胞表达量骤增,可能这个marker也会在其他细胞类型中检测到。
这两种都不合适就要利用最粗暴的观察手段,依据大小、形状、在组织中的位置等特征
3 收集细胞的传统手段
主要有三种:显微操作、荧光激活细胞分选(FACS)、激光纤维切割捕获(LCM),这三种方式都有成熟、标准化的流程。前两种可以在体外或脱离组织条件下分离细胞,LCM需要将细胞或组织固定(因此大多会导致细胞死亡,不过现在也有利用LCM分析活细胞的例子)。另外这三种方法的通量也是不同的,FACS分选细胞非常高效,短时间内就能分选上千细胞;显微操作和LCM方法就非常慢,通量也低。
因为前两种方法需要组织裂解,所以基因的表达可能会受到影响,影响因素也有很多,例如:裂解方法、组织类型、试剂浓度、孵育时间、温度等等,LCM方法因为是直接将RNA固定住,因此它会受这些外部因素影响小一些。不过LCM使用的固定试剂(例如福尔马林)会使RNA产生降解,虽然现在有了不含福尔马林的固定剂,但RNA的质量还是会受到影响。
LCM方法最大的一个优势就是它能记录空间信息,其他两种因为做了组织裂解,所以得到的细胞不知道原来在组织的什么位置;另外一个优点就是残余的组织可以保存留用。不过这个方法需要技术的辅助,既然是切割,那么就存在混进不相关细胞的可能。细胞污染这个问题在显微操作中也会存在,不过它混进来的可能是一点溶剂。既然可能存在“混杂”的问题,那么设置阴性对照就显得很有必要。
这三种方法的具体对比如下图:
分离得到细胞后,一般会收集到裂解缓冲液中,准备后续的scRNA的寡核苷酸barcode结合或质谱技术的镧系元素barcode结合。目前的趋势是将细胞收集和后续反应整合在一个设备中(就像10X的设备),实现end-to-end solution。
4 收集细胞的现代手段
变革进化
仪器公司的不断进步
首先是高通量市场:
Illumina+BioRad生产的ddSEQ Single-Cell Isolator为不同起始细胞数提供了定制的试剂盒;
10X推出的Chromium可以在一个仪器中进行各种分析(基因组、外显子、转录组、免疫相关);
BD Rhapsody可以定制化panel,实现靶标DNA/RNA测序;
Nadia Innovate可以实现单细胞收集参数的完全控制;
然后是低通量市场:
C1:新的C1 Fluidigm芯片能实现800个细胞的测序,实现从细胞捕获到结果报告的流程
ICELL8:可以分析大量的细胞,同时又可以可视化控制、挑选部分细胞进行下游分析
高通量仪器
大多数仪器都配置了微流控的“lab-on-chip”技术,能产生数百万的定制的液滴,其中会包含单个细胞、寡核苷酸(例如用:anchored oligo-dT,目的是捕获mRNA)、反转录试剂(产生cDNA),然后整个文库制备一般会在gel beads中进行(例如10X);另外液滴也可以单纯作为捕获容器,后续的反应及文库制备会在magnetic beads中进行(例如BD)。这种建库测序的技术发展出了:Drop-seq、inDrop-Seq、SCRB-Seq或者公司自己设计的方案。以上的几种方法都是基于poly-A富集mRNA的,因此它们属于3'端建库。
为了将建库测序得到的reads成功回溯到某个细胞,就要在寡核苷酸上“做手脚”。每个细胞分配了一段特定的序列,叫做barcode。来自一个细胞的reads都共享同样的barcode。另外还有一种情况,就是Illumina短序列测序需要扩增,扩增后才能根据cluster(也就是簇,一簇的reads都相同)来增加测序的准确性。当然也就是在PCR这一步,可能会引入偏差(来源:不同的扩增模板的扩增效率不同,从而影响原始的数量比例)。对单细胞来讲,它和bulk 转录组不同,本来reads数量就不多,如果再加上PCR bias的影响,噪音就太大了。于是引入了UMI(unique molecular identifiers,这个molecular就是指cDNA),每个初始cDNA分配一个独特的UMI。如果扩增完发现,有两个reads都属于同一个cDNA molecule,它们的UMI就是一样的,最后定量只会被计数一次
个人思考:PCR也不是十全十美,复制的结果就百分百和初始一样,也会有错误率。同一批cDNA扩增的结果也有可能差几个碱基,那么来自同一个cDNA的两条reads的UMI可能就不一样,差一两个碱基是可能的,因此后续计算的时候,可能会设置一个容错值(可能需要结合UMItools说明书看一下),就是说如果来自同一个cDNA的两条reads结果UMI之差1个碱基其余都一样,那么可能也会判断它们是来自同一个cDNA的
尽管基于液滴的技术很先进,但是也有局限。最主要的缺点就是RNA捕获效率低,反转录施展不开(因为反转录过程只是发生在非常小的液滴空间中)、液滴很脆弱(泄露有风险),另外当起始细胞数量有限时,细胞捕获效率低。但同时如果起始细胞数量太多,又容易导致douplets现象(一个液滴中包含两个细胞),而且容易堵塞微流控芯片。因此,其他厂商探索了一些方法,利用细胞板(其中包含了成千上万个微孔)捕获大量细胞,并且每个微孔中也是放入了一个连接寡核苷酸的bead。之后的下游操作和基于液滴的方法就相似了。
下面👇分别来看一下
4.1 Chromium System(10X)
Chromium Single Cell 3′ Solution于2016年10月发布,亮点在于可以测几百乃至几万细胞,数量区间很大。利用了GemCode技术产生barcode。大体流程:
gel bead包含了barcode、UMI、反转录试剂 + 油滴中的细胞 =》 液滴(所谓的“油包水”)=》 这其中进行了细胞裂解、反转录反应,合成了cDNA =》 每个液滴混合在一起、然后溶解 =》 就构建好了cDNA文库
这个技术的细胞捕获率能到65%,双细胞率也很低,而且每次试剂更新都会降低这个比例,增加检测转录本的和数量。样本是在微流控芯片中进行处理的,每个芯片10-20分钟可以处理8个样本,产生100-80000个细胞。
4.2 Rhapsody Single-Cell Analysis System (BD)
2017年九月发布,它是Resolve平台的升级版,它是目前市场上仅有的不依赖于液滴技术的高通量建库平台。它的机器包含了一块布满20万微孔的板子,其中放了UMI-barcoded 磁珠,最多可以捕获2万个细胞。捕获的细胞裂解,然后mRNA附着在beads上。这些beads混合起来,然后在单个管中建库。当然,系统会在细胞裂解前进行扫描,统计捕获细胞数量、双细胞数量、空孔数量,帮助用户自主选择多少beads进行建库,样本的质量能不能满足后续要求。至于剩下的beads,可以留着后续使用,这样可以节省后续的费用。另外它使用了targeted RNA-Seq的方法,也就是只会扩增感兴趣的转录本 。
4.3 C1 System and Polaris (Fluidigm)
C1可以说是现代单细胞领域的开拓者,它于2012年发布,是第一个处理单细胞组学分析的仪器。它的操作主要在integrated fluidic circuit (IFC 芯片)上完成,每次可以处理96个细胞。目前至少有100篇文献使用这个技术,涵盖了转录组、全基因组、外显子、靶标DNA测序、表观、miRNA表达。这个平台的拓展性很强,可以使用不同的芯片(如:C1 Single-Cell Open App IFC chip)和自定义的实验方案(C1 Script Builder);
另外这个公司2015年开发的一款叫Polaris平台,是第一个也是唯一一个 unique unified workflow for active cell selection, cultivation, and molecular analysis (up to 48 cells per run)
4.4 Nadia and RNA-Seq System (Dolomite Bio)
这家公司是2016年成立的,在2017年11月推出了Nadia的单细胞测序平台(也是利用Drop-seq的全自动平台)。它也是将单个细胞包裹在一个微珠(bead)中,微珠的表面富含捕获寡核苷酸和UMI。 和上一个gel bead方案不同的是: 这个液滴中不含有反转录试剂。反转录过程是发生在微珠收集并破裂以后。这样做的好处就是:它不用受限于在皮微级别的微珠内进行,可以在外边大展拳脚。但话说回来,它比gel bead的细胞捕获效率要低。
结论
细胞富集技术(如FACS)和高通量单细胞仪器整合起来是一个趋势,这样可以避免测一大批细胞,最后仅仅用了一小部分,造成各方面的浪费。这样整合起来可以有的放矢,我们可以仅仅选择感兴趣的细胞,然后高通量测序
一大挑战就是细胞质量的控制,目前没有评估单个细胞质量的工具。当然是可以根据bulk 转录组结果的表达量来定一个阈值,对每个细胞进行鉴定,比如看每个细胞中最少表达的基因数量。但不论怎样,这些方法都是后续的检验,我们的样本已经被处理完了,最优解还是测序之前就保证细胞的质量
多个组学联合分析是前景( DNA, mRNA, regulatory RNA, proteins, metabolites),像10X就抓住了这个机会,好像BD也推出了Rhapsody蛋白检测的功能
最后就是针对分析工具整合的期待,还没有一个公认的分析流程出来,只有推广度高低之分,比如Seurat、Scater、Monocle这几个R包就推得比较多,那么说不定未来的标准流程就是它们
最后更新于