4.13 实战十三 | 10X | 小鼠乳腺上皮细胞

刘小泽写于2020.7.21

1 前言

数据来自Bach et al. (2017),使用的是妊娠期小鼠乳腺上皮细胞 + 10X技术建库

数据准备

library(scRNAseq)
sce.mam <- BachMammaryData(samples="G_1")
sce.mam
# class: SingleCellExperiment 
# dim: 27998 2915 
# metadata(0):
#   assays(1): counts
# rownames: NULL
# rowData names(2): Ensembl Symbol
# colnames: NULL
# colData names(3): Barcode Sample Condition
# reducedDimNames(0):
#   altExpNames(0):

数据初探

ID转换

依然是整合行名 + 添加染色体信息

2 质控

依然是备份一下,把unfiltered数据主要用在质控的探索上

使用线粒体信息进行过滤

作图

再看看线粒体含量与文库大小的关系

最后过滤

3 归一化

使用去卷积的方法

4 找高变异基因

这里由于是10X的数据,所以会有UMI信息,因此可以用基于泊松分布的模型构建方法

最后做个图

5 降维聚类

降维

聚类

有一个很重要的参数是k ,含义是:the number of nearest neighbors used to construct the graph。如果k设置越大,得到的图之间联通程度越高,cluster也越大。因此这个参数也是可以不断尝试的

我们这里由于细胞数量比较多,所以设置的k就比较大,得到的cluster就少而大

作图

最后更新于

这有帮助吗?