2.1.4 综述 | scRNA已经开发出超过1000款工具了，你用过几种？

刘小泽写于2021.8.24

速览

R工具目前还是居多，但越来越多的工具采用python开发，而基于R的开发数量正在下降；因为单细胞数据量和复杂度都在逐步提高，而性能方面的优势使得python逐渐提升
另一个因素在于：曾经的bulk RNASeq一般都是生命科学领域的研究人员关注，解决的也是生物问题；而scRNA具有更高的探索性，因此有时在降维聚类等方面需要结合机器学习这种更加复杂的统计方法，所以计算科学领域的研究人员也逐渐加入，而python也是他们所常用的机器学习工具
按这个速度推断，2025年中期python就会超过R，成为scRNA数据分析领域最为热门的语言
B图中可以看到红线上方的”潜力股工具“：integration和classification。早期受到测序条件和经费的限制，可能一个实验只能做一个样本或者很少几个样本，但现在大样本量逐渐成为趋势（比如最大的Human Cell Atlas），因此如何整合以及处理批次效应，就成了一个重点
随着研究逐渐深入，样本整合越来越多，细胞类型的细分也成为趋势，比如下面这一张。之前细胞类型的推断可能更偏向于根据表达量计算距离，后来的方案则更好地利用了公共参考数据库的资源辅助推测（比如SingleR中就包含了一些内置数据集，大部分是bulk RNA-Seq或芯片数据中经过筛选的细胞类型）

最后更新于4年前