4.13 实战十三 | 10X | 小鼠乳腺上皮细胞
刘小泽写于2020.7.21
1 前言
数据来自Bach et al. (2017),使用的是妊娠期小鼠乳腺上皮细胞 + 10X技术建库
数据准备
library(scRNAseq)
sce.mam <- BachMammaryData(samples="G_1")
sce.mam
# class: SingleCellExperiment
# dim: 27998 2915
# metadata(0):
# assays(1): counts
# rownames: NULL
# rowData names(2): Ensembl Symbol
# colnames: NULL
# colData names(3): Barcode Sample Condition
# reducedDimNames(0):
# altExpNames(0):数据初探
ID转换
依然是整合行名 + 添加染色体信息
2 质控
依然是备份一下,把unfiltered数据主要用在质控的探索上
使用线粒体信息进行过滤
作图

再看看线粒体含量与文库大小的关系

最后过滤
3 归一化
使用去卷积的方法
4 找高变异基因
这里由于是10X的数据,所以会有UMI信息,因此可以用基于泊松分布的模型构建方法
最后做个图

5 降维聚类
降维
聚类
有一个很重要的参数是
k,含义是:the number of nearest neighbors used to construct the graph。如果k设置越大,得到的图之间联通程度越高,cluster也越大。因此这个参数也是可以不断尝试的
我们这里由于细胞数量比较多,所以设置的k就比较大,得到的cluster就少而大
作图

最后更新于
这有帮助吗?