4.3 实战三 | 10X | 未过滤的PBMC
刘小泽写于2020.7.19
1 前言
2 数据准备
下载
library(BiocFileCache)
bfc <- BiocFileCache("raw_data", ask = FALSE)
raw.path <- bfcrpath(bfc, file.path("http://cf.10xgenomics.com/samples",
"cell-exp/2.1.0/pbmc4k/pbmc4k_raw_gene_bc_matrices.tar.gz"))
untar(raw.path, exdir=file.path(tempdir(), "pbmc4k"))
# 最后也就是得到这三个文件:barcodes.tsv genes.tsv matrix.mtx读取
library(DropletUtils)
fname <- file.path(tempdir(), "pbmc4k/raw_gene_bc_matrices/GRCh38")
sce.pbmc <- read10xCounts(fname, col.names=TRUE)
# 看这里的数量惊人,但是后面还需要过滤
sce.pbmc
# class: SingleCellExperiment
# dim: 33694 737280
# metadata(1): Samples
# assays(1): counts
# rownames(33694): ENSG00000243485
# ENSG00000237613 ... ENSG00000277475
# ENSG00000268674
# rowData names(2): ID Symbol
# colnames(737280): AAACCTGAGAAACCAT-1
# AAACCTGAGAAACCGC-1 ... TTTGTCATCTTTAGTC-1
# TTTGTCATCTTTCCTC-1
# colData names(2): Sample Barcode
# reducedDimNames(0):
# altExpNames(0):转换ID,添加染色体信息
3 质控
数据备份
根据原来的数据,加上质控标准作图

再看下文库大小分别和线粒体含量的关系

4 归一化

5 找表达量高变化基因

6 降维
7 聚类

8 找marker基因并解释结果


最后更新于