# 2.2.14 研究 | 2021-单细胞水平看骨髓瘤的细胞状态和基因调控

## 前言

题目：Dynamic transcriptional reprogramming leads to immunotherapeutic vulnerabilities in myeloma

日期：2021-10-21

期刊：Nature Cell Biology

链接：<https://www.nature.com/articles/s41556-021-00766-y>

## 一句话概括

7张主图+10张附图，而且每一张都至少有5-6张小图，使用**上百张图片**来说明：利用单细胞转录组+表观遗传分析骨髓瘤的细胞状态，从而研究异质性，帮助理解其中的基因调控网络，并帮助识别潜在的治疗靶点

## 需要补充一点背景知识

> <https://www.zs-hospital.sh.cn/zsyy/n33/n35/n48/n399/n403/u1ai3894.html>

**骨髓**位于人体较大的骨骼的腔中，约占人体体重的 5%，含有间充质干细胞和**造血干细胞**

人体所有的血细胞都是由造血干细胞分化、增殖而成的，包括：红细胞、白细胞和血小板

* 红细胞：可以将氧气从肺部输送至身体的各个部位
* 血小板：具有止血功能
* 白细胞：人体免疫系统的基石，包括淋巴细胞、单核细胞、粒细胞

浆细胞是淋巴细胞中 B 淋巴细胞分化的产物，它能分泌抗体，消灭入侵人体的病毒、细菌等。如果 B 淋巴细胞在分化成浆细胞的过程中 DNA 受到破坏，这个异变的浆细胞回到骨髓后，又再次受到环境的刺激时，就会发生癌变，也就成为了**骨髓瘤细胞**。

相比于正常的浆细胞，骨髓瘤细胞会以更快的速度分裂，并且分泌一种异变蛋白 - Paraprotein，这种异变蛋白没有抗体的免疫功能，医学上叫单克隆伽马球蛋白，或者单克隆丙种球蛋白

## 转录机制part1——表达

> 不过文章写了8个病人，但主图只显示了7个，而且也没看到说明原因

选取8个relapsed/refractory MM病人骨髓或血液中的骨髓瘤细胞以及CD45+ 免疫细胞，以及2个健康供体，使用SmartSeq2得到单细胞全长转录组，共 6,955 cells，利用`PAGODA2`进行分群，其中 clusters 20, 1, 5, 7, 14, 12, 3 and 13对应了CD4+ and CD8+ T cells, NK cells, B cells, monocytes and neutrophils（中性粒细胞）；clusters 2, 4, 6, 8, 10, 11, 15, 16, 17 and 19对应了plasma cell

> multiple myeloma (MM)，多发性骨髓瘤

然后分析CNV区分恶性和非恶性细胞，不管是malignant score（图f）还是CNV扩展、缺失（图e），MM样本都要比ND正常样本高。另外还使用随机森林模型，寻找区分这两种类型细胞的marker基因，像是*CCND1*、FRZB13都是之前报道过的，而且这个CCND1在3/8的MM病人中都高表达。另外，还看了其他的signature，比如*NFKB* signature主要在MM1病人表达，proliferation signature *PR* 主要在MM8病人表达

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-01-084420.png)

### **既然表达有差异，那么接下来继续深入探索**

**首先推测：细胞周期对表达异质性会有影响**

> G、S、M期(<https://en.wikipedia.org/wiki/Cell\\_cycle>)
>
> * G1期（间期的DNA合成前期）
> * S期（间期的DNA合成期），启动DNA合成
> * G2期（间期的DNA合成后期）
> * M期（有丝分裂期），存在检测点和抑制点
>
> <img src="https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-023909.png" alt="image-20211104103909490" data-size="original">

发现分群之间没有太大的细胞周期差异（除了cluster10，可能因为这个cluster覆盖的病人样本比较多吧）

**然后，使用非负矩阵分解(negative matrix factorization，NMF)**

得到6个表达模式，除了细胞周期，还有很多细胞信号通路，包括KRAS–MAPK signalling, IL-2–STAT5 signalling, the interferon (IFN) response and IL-6–STAT3 signalling

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-023740.png)

### 探索骨髓瘤细胞转录水平变化的方向

> BLUEPRINT不同的细胞类型：<https://www.blueprint-epigenome.eu/index.cfm?p=7BCEDA45-EC73-3496-2C823D929DD423DB>

使用BLUEPRINT数据集的不同细胞谱系的signature，发现骨髓瘤细胞的转录状态主要集中于浆细胞（PC）和一些未成熟的前体细胞（Megakaryocyte-erythroid precursor ，MEP）【图ab】，确实存在不同的变化阶段

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-063208.png)

**接着利用RNA velocity analysis看了分化轨迹**

得到一个由低分化向高分化的轨迹，正常样本的浆细胞聚集在尾部（标志着分化的结束），而正在分化的细胞聚在头部。再结合上图的e图，使用CytoTRACE看到骨髓瘤细胞具有比正常浆细胞更高的CytoTRACE score，标志着更好的分化潜能

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-063752.png)

**接下来，看分化轨迹两端的差异**

拿到CytoTRACE 分数高的细胞（也代表了未成熟状态），找到他们的top基因，做了通路（上图g），发现与代谢途径、Myc激活有关，还有一个plasmablast-like signature。

另外发现头尾具有截然相反的通路激活情况，比如上面的图h中MAPK通路，在头部高尾部低；而PI3K是尾部更高

## 转录机制part2——调控

### **首先看基因调控网络GRN**

【图a】利用SCENIC看转录因子活性，利用BLUEPRINT数据，找到正常造血中的主导调控因子存在于浆细胞（PC module）；

【图b】再看自己的数据：正常的供体中，这个PC module确实占主导；而骨髓瘤样本中，PC module除了在浆细胞，还在haemopoietic stem cell 、macrophage等类型中发现

接下来就是寻找骨髓瘤细胞特异的调控网络（图c），但其中好多调控元件在正常的数据中都没有或者很弱，比如ELF3、TEAD4（图d）

* ELF3 is a member of the epithelium-specific ETS TFs expressed predominantly in epithelial tissues
* TEAD4 acts as a downstream regulator of the Hippo pathway and binds to the M-CAT motif found primarily in muscle-specific genes

另外还发现了恶性和正常的浆细胞共有的一些调控元件，比如*XBP1*, *IRF4* and *PRDM1* ，说明骨髓瘤细胞还是保留了一些原有细胞谱系的印记

接着，引入一个指标（**rewiring score**），意思是看看一个调控元件改变后，与之相关的基因变化程度（在网络中可以理解为node对targets的影响；或者简单理解为rewiring score代表了影响力）。发现ELF3和TEAD4是两个得分最高的，其次是XBP1，说明它们对基因影响是比较大的。

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-081342.png)

### **调控差异的产生，对染色质可接近性有影响吗？**

对5个病人+3个正常做了scATAC-seq，得到 1,483个细胞，注释分群得到：

* clusters 1–6：plasma cell
* clusters 7, 8 and 9：monocytes, B cells and NK cells

同时对比图b、c发现了cluster分群存在病人特异性，说明不同病人存在不同的染色质差异

![image-20211104165510661](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-085510.png)

接着做了peak calling，其中MM特有的是29,761个peaks，而正常特有的只有不到8000个；另外用DESeq2找了MM和正常的差异peaks，差异也是一致的（图c-d）

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-083106.png)

用`ChromHMM`对peaks进行注释，发现很多MM的peaks落在了异染色质，并且在intronic and intergenic区域更多，说明MM可能募集到更多的增强子enhancer；同时发现MM的可开放区域距离TSS很远，这个和之前报道的骨髓瘤H3K27 乙酰化程度升高一致

![image-20211104163825168](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-083825.png)

为了阐释scATAC数据集的差异，做了拟时序分析。发现在MM中比较重要的一些基因，比如CCND1和ELF3，在轨迹的”头部“表现更高的开放程度【主图e】，又分析了motif accessibility，发现NF-κB family members *REL*, *RELA* and *NFKB1* 得分比较高，并且集中于”尾部“的正常样本。用`chromVAR` 进行差异分析，得到276个TFs。

图i-j基于*ELF3* and *TEAD4* 预测了顺式作用因子， 为MM中存在增强子激活再次提供证据
