4.11 实战十一 | Smart-seq2 | 小鼠造血干细胞
刘小泽写于2020.7.21
1 前言
数据来自 (Nestorowa et al. 2016) 的小鼠造血干细胞 haematopoietic stem cell (HSC) ,使用的技术是Smart-seq2
准备数据
library(scRNAseq)
sce.nest <- NestorowaHSCData()
sce.nest
# class: SingleCellExperiment
# dim: 46078 1920
# metadata(0):
# assays(1): counts
# rownames(46078): ENSMUSG00000000001
# ENSMUSG00000000003 ... ENSMUSG00000107391
# ENSMUSG00000107392
# rowData names(0):
# colnames(1920): HSPC_007 HSPC_013 ... Prog_852
# Prog_810
# colData names(2): cell.type FACS
# reducedDimNames(1): diffusion
# altExpNames(1): ERCC
counts(sce.nest)[1:3,1:3]
# 3 x 3 sparse Matrix of class "dgCMatrix"
# HSPC_007 HSPC_013 HSPC_019
# ENSMUSG00000000001 . 7 1
# ENSMUSG00000000003 . . .
# ENSMUSG00000000028 4 1 2看到使用了ERCC、Ensembl ID
ID转换
2 质控
依然是备份一下,把unfiltered数据主要用在质控的探索上
这里没有线粒体基因,因此只能用ERCC计算过滤条件
做个图

最后对数据进行过滤
3 归一化
4 找表达量高变化基因
使用基于ERCC的构建模型方法
然后把基因(黑点)、ERCC(红点)、根据ERCC拟合的线(蓝线)画出来

5 降维聚类
降维
聚类
作图

6 marker基因检测
比如检测一下cluster8:
看到其中血红蛋白相关基因(Hba1、Hba2、Hbb)、Car2、Hebp1基因上调,说明clsuter8可能包含红细胞前体细胞

7 细胞类型注释
将会使用内置的参考注释数据,
SingleR中就包含了一些内置数据集,大部分是bulk RNA-Seq或芯片数据中经过筛选的细胞类型。
准备参考数据
进行转换
这里也看到cluster8与红细胞更相近

最后更新于
这有帮助吗?