nature

当前位置: Nature » 基因&基因组学 » 正文

Sci Rep:中科院计算机所邵振研究组等发表PRC2与lncRNA相互作用的序列特异性研究进展

摘要 : 2017年1月31日,国际学术权威刊物自然出版集团旗下子刊《Scientific Reports》杂志在线发表了中国科学院-马普学会计算生物学伙伴研究所邵振研究组关于PRC2与长非编码RNA(lncRNA)之间相互作用的序列特异性研究论文

2017年1月31日,国际学术权威刊物自然出版集团旗下子刊《Scientific Reports》杂志在线发表了中国科学院-马普学会计算生物学伙伴研究所邵振研究组关于PRC2与长非编码RNA(lncRNA)之间相互作用的序列特异性研究论文,论文题为“The PRC2-binding long non-coding RNAs in human and mouse genomes are associated with predictive sequence features”。计算生物学研究所博士研究生涂世奇为论文第一作者,邵振研究员指导为论文通讯作者。

由多梳(PcG)家族蛋白组成的表观调控复合物PRC2是控制动物组织发育的重要因子,但在高等动物中PRC2如何被特异性招募到染色质特定区域的分子机制还不清楚。随着XIST与HOTAIR等PRC2结合lncRNA的发现,人们猜测此类lncRNA可能决定了PRC2染色质招募的特异性(Margueron et al. Nature 2011)。但是,直到现在PRC2与RNA结合是否具有序列特异性仍被广泛争论(Davidovich et al. Mol Cell 2015)。邵振研究组首先开发了一个基于马尔可夫链思想的序列组成分析流程,通过计算不同核苷酸间转移在每条序列中出现的频率来刻画其组成,进而选择被特定序列所显著偏好或不偏好的核苷酸间转移作为它们的序列组成特征,并通过将所有可能的转移映射到一个完整四叉树来研究所选序列特征在特征空间中的分布是否具有非平凡性。通过将该流程应用于人基因组中已知的数百个PRC2结合lncRNA,该研究系统分析了这些lncRNA的序列特征,发现其偏好的序列特征倾向在四叉树上组成连续偏好路径,并且这些连续路径上的序列特征倾向于同时被人和小鼠基因组中的PRC2结合lncRNA所偏好。

受此启发,该研究整合小鼠胚胎干细胞中两组已发表的RIP-seq和CLIP-seq数据,定义了一组高可信度的小鼠PRC2结合lncRNA,发现这些lncRNA能够被人基因组中已知PRC2结合lncRNA所具有的序列特征较好地预测。这些研究发现表明高等动物中PRC2与lncRNA结合具有序列特异性,并且其特异性具有较高的跨物种保守性。此外,该研究还通过发展一个局域打分模型,发现PRC2结合lncRNA的序列特征在lncRNA上的分布表现出明显的非随机性。进一步研究发现,每个lncRNA上PRC2与lncRNA结合所偏好序列特征最富集的小片段(定义为PRC2偏好片段),相对lncRNA其它部分具有显著更高的进化保守性和RIP-seq信号强度(如图),说明这些序列特征的局域富集具有明确的功能意义。

图:PRC2结合lncRNA的序列特征在lncRNA上的分布表现出明显的非随机性, 并且这些序列特征的局域富集具有明确的功能意义

原文链接:

The PRC2-binding long non-coding RNAs in human and mouse genomes are associated with predictive sequence features

原文摘要:

Recently, long non-coding RNAs (lncRNAs) have emerged as an important class of molecules involved in many cellular processes. One of their primary functions is to shape epigenetic landscape through interactions with chromatin modifying proteins. However, mechanisms contributing to the specificity of such interactions remain poorly understood. Here we took the human and mouse lncRNAs that were experimentally determined to have physical interactions with Polycomb repressive complex 2 (PRC2), and systematically investigated the sequence features of these lncRNAs by developing a new computational pipeline for sequences composition analysis, in which each sequence is considered as a series of transitions between adjacent nucleotides. Through that, PRC2-binding lncRNAs were found to be associated with a set of distinctive and evolutionarily conserved sequence features, which can be utilized to distinguish them from the others with considerable accuracy. We further identified fragments of PRC2-binding lncRNAs that are enriched with these sequence features, and found they show strong PRC2-binding signals and are more highly conserved across species than the other parts, implying their functional importance.

来源: Scientific Reports 浏览次数:0

热门文章TOP

RSS订阅 - 填写您的邮件地址,订阅我们的精彩内容: - 网站地图
网站联系电话:020-87540820 备案号:粤ICP备11050685号-8 增值电信业务经营许可证:粤B2-20120479
©2011-2015 生物帮 All rights reserved.