细胞生物信息分析与处理2022-12-13 08:57:40
随着细胞信息高通量检测技术的发展,大量细胞相关数据产生,如DNA、蛋白质、图像信息等,旨在对细胞生命活动进行量化表征。这些数据通常过于庞大以至于依靠人力难以对其进行分析处理, 而利用人工智能技术不仅能够处理人类大脑难以完成的任务,还可以通过训练的方式不断自我完善. 这类技术在基因组学、转录组学、蛋白质组学、代谢组学]等领域已有广泛应用,为疾病筛查识别、精准医疗提供强有力工具。2018年,Zhou等开发了一个基于深度学习的框架ExPecto,其可以于DNA序列从头开始准确预测突变的组织特异性转录效应,包括那些罕见或未观察到的突变。它在从200种人体组织和细胞类型中获得的多个组学数据上进行训练,以预测基因序列变异对基因表达和细胞类型特异性的影响. 在最近一项工作中, Rives等在2.5亿个蛋白质序列中的860亿个氨基酸上训练了一个转换器. 这种无监督的预训练模型提供了蛋白质结构的多尺度表示,包含有关二级和三级链组织、同源性、接触和突变效应的信息.该模型具有广泛应用前景,如生成新序列和设计功能蛋白质。
显微镜作为生命科学的中心方法,可在细胞生命全周期获取大量定性/定量的图像数据。海量图像数据为基础生物学、高通量药物筛选、数字病理等领域提供了更多的科学依据。基于图像的分类方法结合免疫染色或谱系追踪等基础细胞研究方法, 允许以很少的成本对大量细胞进行形态分析和筛选,从而对细胞的生物学行为以及临床应用如癌症筛选,药物鉴定等有重要意义。与复杂、耗时且成本高昂的传统遗传和表观遗传工作流程相比,获取和分析细胞图像是一个相对简单且经济的过程,能提供前所未有的数据吞吐量,且高通量生物技术的筛选允许在各种情况下量化动态细胞的表型变化。
出自《细胞生物信息学及技术》作者顾宁,王方旭,李艳。
上一篇: 甲状腺激素对神经干细胞温度的影响
下一篇: 细胞生物学研究及临床问题探讨