Monocle2通过t-SNE选取在细胞群间差异表2022-04-29 09:17:01
目前,scRNA-seq数据一般通过降维的手段去除噪声、简化样本之间的变化,使多基因(数十个或几百个)之间的数据差异可视化。诸如tSNE、UMAP、PCA等算法可以将复杂数据简化生成二维模型以达到可视化的目的。对这些降维后的数据随后便会根据需求进行下游分析, 包括差异基因表达、上下游信号通路富集、轨迹分析等。Monocle是进行单细胞轨迹分析的有力保障, 通过单细胞转录组的表达矩阵, 利用无监督算法将细胞归位于不同的发育轨迹分支上,从而模拟细胞群体生物学过程。其能够将细胞按照模拟的时间顺序进行排列, 展现包括细胞分化等生物学过程。基于Monocle的Monocle2则是目前应用最为广泛的分析手段,可用于所有的scRNA-seq数据集,并且不需要有关细胞命运或有关分支点的信息输入, 即可模拟出时间发育过程的动态变化。一般来说, Monocle2首先通过t-SNE选取在细胞群间差异表达的基因, 随后使用dpFeature算法进行密度峰聚类, 以半监督的分析模式, 针对目的细胞亚群进行个性化分析。2019年,CAO等研发出Monocle3,其利用UMAP进行降维,针对小鼠器官发生过程, 重建了56条不同细胞亚型的轨迹。现在, 将scRNA-seq与各种算法相结合是一个常规的研究方法,该流程可以针对不同的研究目标, 从单细胞水平鉴定稀有的细胞类型, 评估细胞的异质性, 同时也能阐明细胞的动力学特征并揭示细胞间的交互作用。
出自《单细胞技术与干细胞疗法在心脏疾病研究中的应用》作者凤琦,王利。
下一篇: 单细胞技术对干细胞研究的意义