新工具集成了多种单细胞数据集有助于细胞类型的定义
单细胞研究揭示了细胞的细节,可能在其他分析中被忽略。生物学家目前使用一系列方法收集不同组织和物种的单细胞数据。一位研究人员可以使用原位(基于组织)方法来观察小鼠神经元中的DNA甲基化,而另一位研究人员使用液滴方法来检查人神经元中的RNA表达。
这些研究创建了许多不易组合的不同数据集。但是,结合这些数据来比较多个个体,组织和物种的相似细胞的所有方面对于真正理解细胞类型的不同作用是必要的。
在Cell中描述,这是由斯坦利精神病研究中心的准会员Evan Macosko创建的新工具;斯坦利中心的访问科学家约书亚韦尔奇和他们的团队将这些部分结合在一起。基因组实验关系的链接推断(LIGER)整合来自不同单细胞数据集的数据;将相似的细胞分组在不同的受试者,物种或分子量上;并将不同组的关系映射到彼此。
其他常见的单细胞数据集集成方法消除了数据集之间的差异。但是,这些差异在生物学上很重要,例如,在比较健康和受疾病影响的细胞时。LIGER既可以保留差异,也可以识别相似之处,从而实现更丰富的分析。
当研究人员在LIGER中加载数据集时,该工具使用称为“整合非负矩阵分解”的统计方法,根据两个定义特征来识别和聚类细胞:一组对细胞原始数据集唯一的因子和一组因子(其中通常对应于跨数据集的细胞共享的生物学上有意义的信号。这种方法使研究人员能够更清晰地查看来自不同来源的细胞之间的共享和区分特征。
该团队以四种方式测试了LIGER。首先,他们使用该工具量化大脑区域和不同动物之间的小鼠脑细胞类型变异。其次,他们使用LIGER通过比较来自人类和来自大脑相同区域的小鼠的脑细胞来检查不同物种之间的相似性和差异。第三,他们使用该工具研究通过单细胞和原位RNA测序分析的小鼠脑细胞的空间关系,将scRNA-seq测试细胞与其原始脑位置相匹配。第四,研究人员使用LIGER通过合并scRNA-seq和DNA甲基化谱来检查小鼠脑细胞的表观基因组特征。