核糖核酸(RNA)是一类重要的遗传物质,其主要功能之一是通过编码转录成蛋白质。然而,研究发现,非编码RNA占人类基因组转录产物的90%以上。由于不参与编码蛋白质,这类RNA曾被认为是人类基因组的“暗物质”或“垃圾”。
近年来,大量研究成果表明,非编码RNA在许多生命过程中扮演着重要角色。2006年,中国科学院院士、中国科学院生物物理研究所研究员陈润生等人根据碱基数量将非编码RNA分为小、中、长三类:小非编码RNA的碱基数量小于50个,中非编码RNA的碱基数量在50到500个之间,而长非编码RNA的碱基数量超过500个。
日前,陈润生在接受《中国科学报》采访时表示:“目前,生命科学界已经对小非编码RNA开展了大量研究工作,而长非编码RNA的机制和功能研究则应当受到更多关注。”研究表明,在模式生物中,多细胞生物比单细胞生物含有更多的非编码RNA,非编码RNA代表了哺乳动物及几乎所有复杂生物基因组的主要产物。对此,陈润生认为:“非编码序列一定具有某种生物学功能,这意味着存在信息的传递和调控。”
随着后基因组时代的到来,深度测序技术的成熟使得非编码RNA成为研究热点。许多研究表明,与疾病相关的非编码RNA层出不穷,在每一期国际顶尖学术期刊上都能见到全球科学家针对非编码RNA的研究成果。陈润生举例指出,研究发现,一类名为“PCGEM1”的非编码RNA与前列腺癌相关,而名为“MALAT-1”的非编码RNA则与非小细胞肺癌的发生有关。“过去,对于肿瘤的研究大多集中在蛋白质上,而非编码RNA的研究告诉我们,核酸的突变也能引起肿瘤。”陈润生说。
尽管长度小于50个碱基的非编码RNA的研究已经取得突破性进展,但具有功能且长度大于50个碱基的非编码RNA的研究仍处于初期阶段。RNA长度超过100个碱基时将会发生分子折叠,具有特定空间结构的长非编码RNA与小分子RNA相比,其生物作用机制可能存在较大差异。陈润生认为:“系统性地发现新的长非编码RNA,研究它们的空间结构与功能,可能会为我们带来更多的创新机会。”
当然,研究者也认识到长非编码RNA研究面临的挑战。例如,海量的实验数据将带来较大的计算量和分析难度,人体内庞大的微生物群将增加鉴别人类长非编码RNA的复杂程度。此外,如何从普通RNA中识别长非编码RNA以及如何发现长非编码RNA的功能,也是该领域研究面临的重要挑战。