线粒体(mitochondrion)是一种极微小的细胞器,直径约为0.5到1.0微米,广泛存在于大多数真核生物的细胞中,是细胞进行有氧呼吸的主要场所。在此过程中,细胞中的糖类、脂肪和氨基酸被氧化,释放出能量,供给生命活动所需,因此线粒体被称为“能量工厂”或“动力室”。
除了为细胞提供能量,线粒体还参与细胞分化、细胞周期、细胞信息传递和细胞凋亡等重要过程。线粒体功能异常可能导致多种线粒体病,通常影响大脑、肌肉和心脏等能量需求较高的器官。近年来的研究发现,线粒体与多种神经退行性疾病(如帕金森病和阿尔茨海默病)、耳聋、糖尿病、衰老及肿瘤的发生密切相关。因此,深入研究线粒体的结构、代谢和功能,有助于我们理解和治疗由线粒体变异引起的疾病。
线粒体夏娃
线粒体拥有自己的遗传物质,即线粒体DNA(mtDNA),也称为线粒体基因组。线粒体基因组的大小因物种而异,植物细胞中的线粒体基因组通常最大且更复杂,碱基对数在100到2500之间;动物细胞的线粒体基因组较小,约为10到39千个碱基对;而哺乳动物的最小线粒体基因组约为16.5千碱基对。线粒体基因组携带的基因数量有限,目前已知编码2种线粒体核糖体RNA(rRNA,12S及16S)、22种线粒体转运RNA(tRNA)和13种呼吸作用相关酶的亚基(每种约含50个氨基酸残基)。
线粒体基因在复制过程中相当保守,尤其在细胞减数分裂期间不发生重排,只有位点突变率较高,因此特别适合用于系统进化分析,有助于揭示物种间在较短时期内基因变化的情况。线粒体基因组的遗传特性使得男性的线粒体DNA无法遗传给后代,而女性的卵细胞中的线粒体DNA则会传递给后代。因此,基于线粒体基因构建的进化树反映的是母系脉络的演化关系和种群的进化历史。科学家曾对全球不同地区和民族的女性进行线粒体DNA调查,认为现代人的线粒体DNA源自约15万年前的一位女性,这位母系祖先被称为“线粒体夏娃”。通过检测现代人线粒体基因组,可以理清各民族、地区的母系血缘关系;通过分析古生物化石中残留的线粒体DNA序列,可以揭示历史上人类各个民族、种族和家族间的母系血缘关系及迁徙路线。
隐藏的变异
每个线粒体中常有2到10个基因组备份,而每个细胞中含有的线粒体数量从几个(如酵母)到上千个(如肝脏等代谢旺盛的器官)不等。因此,每个细胞中含有的线粒体基因组数量从几十到几千个不等。在线粒体基因组的复制过程中,即使出现复制错误或变异,由于细胞中其他多个备份的存在,这些变异在表型和功能上可能不会显现。经过代代复制、遗传和筛选,一些有意义的变异得以保留并富集,最终形成线粒体基因组单核苷酸变异的多态性(SNP)。
这种隐藏的核苷酸变异通过二代高通量测序技术可以被轻松检测到。二代高通量测序技术能够一次并行对几十万到几百万条DNA分子进行序列测定,高覆盖度的测序使得细胞中多备份的线粒体基因组上携带的SNP能够被准确而高效地检测出来,从而深入解析隐藏在线粒体基因组中的变异和进化信息。
物种的测序
现代人类饲养的家畜是被人类高度驯化的动物,与人类生产生活密切相关。为了满足人类对独特经济性状的需求,其进化方向长期受到人为干扰和人工选择,形成了众多的品种或品系,遗传背景极为复杂。利用线粒体基因组,可以帮助人类理清这些家畜的起源以及种群迁移和扩张路径。
随着二代高通量测序技术的不断完善,越来越多物种的线粒体基因组被深度测序,包括人类、灵长类(猴、大猩猩)、大型哺乳动物(如非洲象、牛、羊、马)、鼠类(如家鼠、负鼠)、犬、猫、鸭嘴兽及鸟类(如原鸡、绿头鸭、吐绥鸡)。生物信息学工具对高覆盖度基因测序的分析,使我们能够清晰而准确地区分在线粒体基因组中检测到的众多SNP位点,判断其是否为线粒体基因组本身因多拷贝而在复制过程中产生的变异(即本底噪音),还是在进化过程中积累、沉淀下来的有意义突变。通过分析这些有意义突变位点在线粒体基因组结构中的位置、对应的核酸和氨基酸特点及功能等信息,可以揭示物种或种群在进化过程中对自然环境或人工选择的适应和进化规律。例如,我们曾对中国特有的17头家猪、2头野猪及国外的9头家猪、2头野猪的线粒体基因组进行比较分析,排除线粒体基因组本身因多拷贝而在复制过程中产生的变异噪音后,清晰发现我国小型猪种和大型猪种在线粒体基因组的蛋白编码区存在明显差异。这些编码蛋白与呼吸作用和能量代谢相关,暗示小型猪和大型猪在长期进化过程中,可能因某些与能量代谢相关基因的突变,通过自然或人工选择,导致了体型大小的区别。这是应用二代高通量测序技术对线粒体基因组深度测序,并利用生物信息学挖掘隐藏在线粒体基因组序列中遗传信息的一个典型例子。
尽管线粒体DNA在遗传学研究中占据重要地位,但其序列信息仅能反映所考察群体中的雌性成员的演化进程,无法代表整个种群。这一缺陷需要通过对父系遗传序列(如Y染色体上的非重组区)的测序来弥补。广义上来说,只有同时考虑线粒体DNA信息和核DNA信息的遗传学研究,才能为种群的进化史提供全面的线索。另一方面,相较于基因组,线粒体基因组所能提供的信息仍然有限,许多参与线粒体功能的蛋白质是由核基因编码并运输至线粒体。因此,必须将线粒体基因组与核基因组共同分析,才能为系统进化分析和揭示线粒体功能异常导致的线粒体疾病提供正确的遗传学信息。在新一代测序技术的支持下,相信这些科学难题将逐步得到解决,从而提升医疗健康水平。