单细胞测序后的原始数据处理和分析2021-09-27 09:03:55
单细胞测序后的原始数据需要经过一系列步骤转换为可读的基因表达矩阵。在生成FASTQ读数后要通过质量控制步骤,筛选掉不符合要求的数据然后用 barcodes 进行复读,再由计算机对映射读数进行量化,以创建一个表达矩阵。标准化的原始数据处理流程和计算机处理所用的数据处理包都可在公开数据库下载。通过对数据标准化处理,以去除非生物技术效应相关的高水平的噪音和差异性,包括在样品制备过程中由于随机RNA丢失、偏倚扩增和文库测序不完整而导致的非准确情形。其他不稳定性也可能来自于对加工单元(如板或阵列)、时间点、设备和其他来源的批量影响。因此,数据标准化成为单细胞数据分析的重要步骤。单细胞的数据分析要根据自己的实验要求设定相应参数。以scRNA-seq为例,主要是对测试样本进行异质性分析,评估新的细胞类型或分析细胞发育过程中发生的基因变化。
通过已知的特定基因对细胞进行分群,而后常见的可视化分析是降维处理并把各个群的细胞投影到二维或者三维坐标空间中去。普遍被人们采用的数据处理方法是主成分分析和t-分布随机邻域嵌入算法。尽管种群标记时允许监督聚类,但在大多数情况下,无假设的非监督聚类是首选的。不同实验间的测试数据已经被上传至公开数据库,允许科研人员免费访问。
出自《单细胞测序技术在肝脏疾病的应用与展望》作者过冬冬,孙芬,贺轩昂。
上一篇: 单细胞多组学测序是分析细胞的重要部分
下一篇: 单细胞测序在肝脏疾病中的研究