记者5月18日从中国科学技术大学获悉,该校生命科学与医学部教授瞿昆课题组设计了一整套分析流程,系统性评估了16种空间转录组和单细胞转录组数据整合算法在预测基因或细胞类型空间分布方面的性能。研究成果于5月16日在线发表于《自然-方法》杂志。
近年来,研究者开发了多种空间转录组技术,在保留细胞精确空间定位的同时,检测细胞内全转录组的表达情况,以此来研究在发育或疾病发生发展过程中起关键性作用的细胞亚群及其分子机制。但目前空间转录组学技术存在两个不足:一是基于测序的空间转录组技术无法实现真正意义上的单细胞分辨率;二是基于成像空间转录组的技术能检测到的基因通量有限。
为了突破技术的局限性,生物信息学家设计了多种算法整合空间转录组与单细胞转录组数据,预测细胞类型的空间分布及单个细胞的完整转录组信息。这些算法大大加深了人们对空间转录组学数据及相关生物学和病理过程的理解。然而,这些整合算法的工作原理和适用范围存在显著差异,研究者很难选择出最佳算法。
瞿昆课题组长期致力于开发生物大数据分析算法和软件。在此项研究中,课题组收集了45对同一组织来源的空间转录组与单细胞转录组数据集,32个模拟数据集,并设计了多种指标,从准确性、鲁棒性、计算资源耗时等多维度系统性评估了16种整合算法的性能。研究工作总结了每种算法的属性、性能和适用性,总结了高效算法的优势,为研究人员进一步提升算法性能提供了参考。同时研究提供的整合空间转录组和单细胞转录组数据的分析流程,有助于研究人员为处理自己的数据选择最佳分析工具。(记者 陈婉婉)