# 2.2.14 研究 | 2021-单细胞水平看骨髓瘤的细胞状态和基因调控

## 前言

题目：Dynamic transcriptional reprogramming leads to immunotherapeutic vulnerabilities in myeloma

日期：2021-10-21

期刊：Nature Cell Biology

链接：<https://www.nature.com/articles/s41556-021-00766-y>

## 一句话概括

7张主图+10张附图，而且每一张都至少有5-6张小图，使用**上百张图片**来说明：利用单细胞转录组+表观遗传分析骨髓瘤的细胞状态，从而研究异质性，帮助理解其中的基因调控网络，并帮助识别潜在的治疗靶点

## 需要补充一点背景知识

> <https://www.zs-hospital.sh.cn/zsyy/n33/n35/n48/n399/n403/u1ai3894.html>

**骨髓**位于人体较大的骨骼的腔中，约占人体体重的 5%，含有间充质干细胞和**造血干细胞**

人体所有的血细胞都是由造血干细胞分化、增殖而成的，包括：红细胞、白细胞和血小板

* 红细胞：可以将氧气从肺部输送至身体的各个部位
* 血小板：具有止血功能
* 白细胞：人体免疫系统的基石，包括淋巴细胞、单核细胞、粒细胞

浆细胞是淋巴细胞中 B 淋巴细胞分化的产物，它能分泌抗体，消灭入侵人体的病毒、细菌等。如果 B 淋巴细胞在分化成浆细胞的过程中 DNA 受到破坏，这个异变的浆细胞回到骨髓后，又再次受到环境的刺激时，就会发生癌变，也就成为了**骨髓瘤细胞**。

相比于正常的浆细胞，骨髓瘤细胞会以更快的速度分裂，并且分泌一种异变蛋白 - Paraprotein，这种异变蛋白没有抗体的免疫功能，医学上叫单克隆伽马球蛋白，或者单克隆丙种球蛋白

## 转录机制part1——表达

> 不过文章写了8个病人，但主图只显示了7个，而且也没看到说明原因

选取8个relapsed/refractory MM病人骨髓或血液中的骨髓瘤细胞以及CD45+ 免疫细胞，以及2个健康供体，使用SmartSeq2得到单细胞全长转录组，共 6,955 cells，利用`PAGODA2`进行分群，其中 clusters 20, 1, 5, 7, 14, 12, 3 and 13对应了CD4+ and CD8+ T cells, NK cells, B cells, monocytes and neutrophils（中性粒细胞）；clusters 2, 4, 6, 8, 10, 11, 15, 16, 17 and 19对应了plasma cell

> multiple myeloma (MM)，多发性骨髓瘤

然后分析CNV区分恶性和非恶性细胞，不管是malignant score（图f）还是CNV扩展、缺失（图e），MM样本都要比ND正常样本高。另外还使用随机森林模型，寻找区分这两种类型细胞的marker基因，像是*CCND1*、FRZB13都是之前报道过的，而且这个CCND1在3/8的MM病人中都高表达。另外，还看了其他的signature，比如*NFKB* signature主要在MM1病人表达，proliferation signature *PR* 主要在MM8病人表达

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-01-084420.png)

### **既然表达有差异，那么接下来继续深入探索**

**首先推测：细胞周期对表达异质性会有影响**

> G、S、M期(<https://en.wikipedia.org/wiki/Cell\\_cycle>)
>
> * G1期（间期的DNA合成前期）
> * S期（间期的DNA合成期），启动DNA合成
> * G2期（间期的DNA合成后期）
> * M期（有丝分裂期），存在检测点和抑制点
>
> <img src="https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-023909.png" alt="image-20211104103909490" data-size="original">

发现分群之间没有太大的细胞周期差异（除了cluster10，可能因为这个cluster覆盖的病人样本比较多吧）

**然后，使用非负矩阵分解(negative matrix factorization，NMF)**

得到6个表达模式，除了细胞周期，还有很多细胞信号通路，包括KRAS–MAPK signalling, IL-2–STAT5 signalling, the interferon (IFN) response and IL-6–STAT3 signalling

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-023740.png)

### 探索骨髓瘤细胞转录水平变化的方向

> BLUEPRINT不同的细胞类型：<https://www.blueprint-epigenome.eu/index.cfm?p=7BCEDA45-EC73-3496-2C823D929DD423DB>

使用BLUEPRINT数据集的不同细胞谱系的signature，发现骨髓瘤细胞的转录状态主要集中于浆细胞（PC）和一些未成熟的前体细胞（Megakaryocyte-erythroid precursor ，MEP）【图ab】，确实存在不同的变化阶段

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-063208.png)

**接着利用RNA velocity analysis看了分化轨迹**

得到一个由低分化向高分化的轨迹，正常样本的浆细胞聚集在尾部（标志着分化的结束），而正在分化的细胞聚在头部。再结合上图的e图，使用CytoTRACE看到骨髓瘤细胞具有比正常浆细胞更高的CytoTRACE score，标志着更好的分化潜能

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-063752.png)

**接下来，看分化轨迹两端的差异**

拿到CytoTRACE 分数高的细胞（也代表了未成熟状态），找到他们的top基因，做了通路（上图g），发现与代谢途径、Myc激活有关，还有一个plasmablast-like signature。

另外发现头尾具有截然相反的通路激活情况，比如上面的图h中MAPK通路，在头部高尾部低；而PI3K是尾部更高

## 转录机制part2——调控

### **首先看基因调控网络GRN**

【图a】利用SCENIC看转录因子活性，利用BLUEPRINT数据，找到正常造血中的主导调控因子存在于浆细胞（PC module）；

【图b】再看自己的数据：正常的供体中，这个PC module确实占主导；而骨髓瘤样本中，PC module除了在浆细胞，还在haemopoietic stem cell 、macrophage等类型中发现

接下来就是寻找骨髓瘤细胞特异的调控网络（图c），但其中好多调控元件在正常的数据中都没有或者很弱，比如ELF3、TEAD4（图d）

* ELF3 is a member of the epithelium-specific ETS TFs expressed predominantly in epithelial tissues
* TEAD4 acts as a downstream regulator of the Hippo pathway and binds to the M-CAT motif found primarily in muscle-specific genes

另外还发现了恶性和正常的浆细胞共有的一些调控元件，比如*XBP1*, *IRF4* and *PRDM1* ，说明骨髓瘤细胞还是保留了一些原有细胞谱系的印记

接着，引入一个指标（**rewiring score**），意思是看看一个调控元件改变后，与之相关的基因变化程度（在网络中可以理解为node对targets的影响；或者简单理解为rewiring score代表了影响力）。发现ELF3和TEAD4是两个得分最高的，其次是XBP1，说明它们对基因影响是比较大的。

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-081342.png)

### **调控差异的产生，对染色质可接近性有影响吗？**

对5个病人+3个正常做了scATAC-seq，得到 1,483个细胞，注释分群得到：

* clusters 1–6：plasma cell
* clusters 7, 8 and 9：monocytes, B cells and NK cells

同时对比图b、c发现了cluster分群存在病人特异性，说明不同病人存在不同的染色质差异

![image-20211104165510661](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-085510.png)

接着做了peak calling，其中MM特有的是29,761个peaks，而正常特有的只有不到8000个；另外用DESeq2找了MM和正常的差异peaks，差异也是一致的（图c-d）

![](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-083106.png)

用`ChromHMM`对peaks进行注释，发现很多MM的peaks落在了异染色质，并且在intronic and intergenic区域更多，说明MM可能募集到更多的增强子enhancer；同时发现MM的可开放区域距离TSS很远，这个和之前报道的骨髓瘤H3K27 乙酰化程度升高一致

![image-20211104163825168](https://jieandze1314-1255603621.cos.ap-guangzhou.myqcloud.com/blog/2021-11-04-083825.png)

为了阐释scATAC数据集的差异，做了拟时序分析。发现在MM中比较重要的一些基因，比如CCND1和ELF3，在轨迹的”头部“表现更高的开放程度【主图e】，又分析了motif accessibility，发现NF-κB family members *REL*, *RELA* and *NFKB1* 得分比较高，并且集中于”尾部“的正常样本。用`chromVAR` 进行差异分析，得到276个TFs。

图i-j基于*ELF3* and *TEAD4* 预测了顺式作用因子， 为MM中存在增强子激活再次提供证据


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://jieandze1314.osca.top/02/2.2.14-yan-jiu-2021-dan-xi-bao-shui-ping-kan-gu-sui-liu-de-xi-bao-zhuang-tai-he-ji-yin-tiao-kong.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
