4.11 实战十一 | Smart-seq2 | 小鼠造血干细胞

刘小泽写于2020.7.21

1 前言

数据来自 (Nestorowa et al. 2016) 的小鼠造血干细胞 haematopoietic stem cell (HSC) ,使用的技术是Smart-seq2

准备数据

library(scRNAseq)
sce.nest <- NestorowaHSCData()

sce.nest
# class: SingleCellExperiment 
# dim: 46078 1920 
# metadata(0):
#   assays(1): counts
# rownames(46078): ENSMUSG00000000001
# ENSMUSG00000000003 ... ENSMUSG00000107391
# ENSMUSG00000107392
# rowData names(0):
#   colnames(1920): HSPC_007 HSPC_013 ... Prog_852
# Prog_810
# colData names(2): cell.type FACS
# reducedDimNames(1): diffusion
# altExpNames(1): ERCC

counts(sce.nest)[1:3,1:3]
# 3 x 3 sparse Matrix of class "dgCMatrix"
# HSPC_007 HSPC_013 HSPC_019
# ENSMUSG00000000001        .        7        1
# ENSMUSG00000000003        .        .        .
# ENSMUSG00000000028        4        1        2

看到使用了ERCC、Ensembl ID

ID转换

2 质控

依然是备份一下,把unfiltered数据主要用在质控的探索上

这里没有线粒体基因,因此只能用ERCC计算过滤条件

做个图

最后对数据进行过滤

3 归一化

4 找表达量高变化基因

使用基于ERCC的构建模型方法

然后把基因(黑点)、ERCC(红点)、根据ERCC拟合的线(蓝线)画出来

5 降维聚类

降维

聚类

作图

6 marker基因检测

比如检测一下cluster8:

看到其中血红蛋白相关基因(Hba1、Hba2、Hbb)、Car2、Hebp1基因上调,说明clsuter8可能包含红细胞前体细胞

7 细胞类型注释

将会使用内置的参考注释数据,SingleR中就包含了一些内置数据集,大部分是bulk RNA-Seq或芯片数据中经过筛选的细胞类型。

准备参考数据

进行转换

这里也看到cluster8与红细胞更相近

最后更新于

这有帮助吗?