4.7 实战七 | SMARTer | 人胰腺细胞
刘小泽写于2020.7.20
1 前言
这次使用的数据是:Lawlor et al. (2017) 中的不同人类供体的胰腺细胞
SMARTer其实不是个像Fluidigm、10X一样的制备系统,它是一个试剂盒。SMART技术是Clontech(Takara旗下全资子公司)的专利技术,2009年升级为SAMRTer技术后,采用更灵敏的SMARTer Oligo和高效的SMARTScribe RT进行逆转录,使其灵敏度提高至皮克级。利用SMARTer技术只需单管、单酶即可完成逆转录,无需接头连接,减少了样品操作步骤,也极大降低了样品损失,保留了原始信息,为RNA-Seq提供了可靠的基础。
2013年 Clontech公司就为Fluidigm的C1单细胞全自动制备系统推出了SMARTer Ultra Low RNA Kit。当时也是能够从C1捕获的单细胞中产生mRNA-seq文库,方便了研究。Fluidigm在C1平台上检验了多款试剂盒,发现SMARTer cDNA合成是最可靠的方法之一
后来很多平台也在使用SMARTer试剂(如WaferGen ICELL8 Single-Cell System),不过后来发现Smart-seq2的扩增效果优于SMARTer试剂盒,而且Smart-seq2技术比传统的SMARTer方法能产生更长和更多的cDNA,在低表达量时,Smart-seq2比SMARTer的基因检出率更高,结果更稳定
数据准备
library(scRNAseq)
sce.lawlor <- LawlorPancreasData()
sce.lawlor
# class: SingleCellExperiment
# dim: 26616 638
# metadata(0):
# assays(1): counts
# rownames(26616): ENSG00000229483 ENSG00000232849 ...
# ENSG00000251576 ENSG00000082898
# rowData names(0):
# colnames(638): 10th_C10_S104 10th_C11_S96 ...
# 9th-C96_S81 9th-C9_S13
# colData names(8): title age ... race Sex
# reducedDimNames(0):
# altExpNames(0):ID转换
2 质控
依然是备份一下,把unfiltered数据主要用在质控的探索上
检查是否有线粒体基因和批次信息
进行质控
看看过滤掉多少
作图看一下

看一下文库大小和线粒体占比的关系

最后把过滤条件应用在原数据
3 归一化
继续使用去卷积方法
4 找表达量高变化基因
这里没有ERCC也没有UMI,所以就用最基础的方法构建模型:modelGeneVar
不过还是要指定批次信息
5 【尝试】矫正批次
这里写“尝试”是因为这里有一个问题:细胞总数不多,才600个,但批次的数量很多,所以归到单独的批次上细胞数就很少。这时如果继续矫正批次,不知道会不会抹除一些真实的生物学特性。
归根结底,还是一个技术噪音与生物因素之间的取舍问题
所以可以尝试一下:
关于这个结果:lost.var ,值越大表示丢失的真实生物异质性越多
It contains a matrix of the variance lost in each batch (column) at each merge step (row).
Large proportions of lost variance (>10%) suggest that correction is removing genuine biological heterogeneity.

看到的确有损失生物异质性的可能性,那么就先放弃这个计划,直接进行下面的降维
5 降维聚类
降维
聚类
看分群与细胞类型之间关系

看分群与批次之间

最后看看批次效应

最后更新于
这有帮助吗?