4.12 实战十二 | 10X | 小鼠嵌合体胚胎

刘小泽写于2020.7.21

1 前言

数据来自Pijuan-Sala et al. (2019),研究的是小鼠E8.5发育阶段的嵌合胚胎

数据准备

# 自己下载
library(MouseGastrulationData)
sce.chimera <- WTChimeraData(samples=5:10)

# 或者加载之前分享的数据
load('sce.chimera.RData')
sce.chimera
## class: SingleCellExperiment 
## dim: 29453 20935 
## metadata(0):
## assays(1): counts
## rownames(29453): ENSMUSG00000051951 ENSMUSG00000089699 ...
##   ENSMUSG00000095742 tomato-td
## rowData names(2): ENSEMBL SYMBOL
## colnames(20935): cell_9769 cell_9770 ... cell_30702 cell_30703
## colData names(11): cell barcode ... doub.density sizeFactor
## reducedDimNames(2): pca.corrected.E7.5 pca.corrected.E8.5
## altExpNames(0):

names(colData(sce.chimera))
# [1] "cell"            "barcode"        
# [3] "sample"          "stage"          
# [5] "tomato"          "pool"           
# [7] "stage.mapped"    "celltype.mapped"
# [9] "closest.cell"    "doub.density"

简单看一下colData中的各个信息

其中包含了6个样本的信息,总共20935个细胞

整合行名

2 简单质控

之前作者已经对数据进行了质控,并把细胞做了标志,这里只需要把标记“stripped”、“Doublet”的细胞去掉即可

3 归一化

看到原来数据中也计算了size factors,那么这里就不需要计算,直接应用

4 找表达量高变化基因

我们的数据有6个样本,可以说异质性非常高了。把它们当做不同的批次信息,并尽可能多地从中保存基因

5 数据整合并矫正批次效应

使用了一种“层次整合”的方法,就是先将同种表型样本整合起来(比如3个处理和3个对照先内部整合),再将不同表型的样本组合(将处理和对照整合)

correctExperiments的含义是:Apply a correction to multiple SingleCellExperiment objects,

看下结果:lost.var 值越大表示丢失的真实生物异质性越多

Large proportions of lost variance (>10%) suggest that correction is removing genuine biological heterogeneity.

6 聚类

看分群与细胞类型之间关系

7 降维

最后更新于

这有帮助吗?