前几期政策与规划的内容(第243~245期)简要介绍了一些冠以“人类”某“组”计划的一些计划或项目,而在人类基因组计划完成后,相继还颁布了一些深入研究基因组的计划,例如,DNA元件百科全书(Encyclopedia of DNA Elements,ENCODE)、千人基因组计划和国际人类基因组单体型图计划等。而这些计划也是后基因组时期的重要“组”类计划,本文对这类组学计划进行简要整理和分析。 1 ENCODE:DNA元件百科全书 1.1 媒体评价 有媒体报道表示,ENCODE是人类后基因组计划中最重要、最核心的部分。 1.2 ENCODE计划概况 1.2.1 ENCODE计划旨在解析非编码DNA的结构和功能 人类基因组计划揭示了在人类基因组中能够编码蛋白质的基因只占整个人类基因组的2%左右,研究人员发现DNA片段不仅可以编码蛋白质,还可以和蛋白质结合,调控基因活性;可以转录成RNA,调节基因的表达;可以进行基因的修饰,发挥沉默基因的作用等。为了解析这些所谓“垃圾DNA”的结构和功能,在2003年9月由美国国立卫生研究院(NIH)下属机构——人类基因组研究所(NHGRI)和欧洲生物信息研究所(EMBL)牵头,开展了ENCODE计划的研究,目的在于对人类基因组进行更为全面而详细的结构、功能和调节的注释,特别是对所谓“垃圾DNA”的结构和功能的分析,旨在识别出人类基因组序列中的所有功能区,包括转录、转录因子联合、染色质结构和组蛋白修饰区,也就是说为非编码DNA序列编制目录,以了解它们会在什么时候、在哪些细胞里被激活,并追踪它们对染色体包装、调节和读取产生的影响。 1.2.2 ENCODE计划的规模和对计划的初步规划思路 ENCODE计划吸引了来自美国、英国、西班牙、日本和新加坡5国32个来自研究机构的440多名科学家的参与,由一个来自政府、科研院所及企业的研究人员所组成的联盟来具体实施。 ENCODE计划在识别出1%人类基因组中的功能元件的目标完成后,研究小组将比较序列的注释,以确定哪些技术被证明效率最高,最准确,然后NHGRI就会扩大计划,注释其余99%的基因组。根据这一整体规划思路来看,ENCODE计划是分阶段实施,循序渐进的过程,下一阶段能否实施取决于上一阶段的成功与否。 1.2.3 计划进展 计划的第一阶段[2003年9月~2007年6月(以成果集中发表的时间为截点来划分);约4年时间,实际上项目实施时间是3年,本文根据计划实际进展情况及具体资助颁布时间来划分],主要包括两个项目,一个中试阶段项目和一个技术开发阶段项目。中试项目通过比对和测试现有方面以精确分析一部分人类基因组序列成分。2007年6月,该中试阶段的成果以发表在Nature和Genome Research杂志上的30篇论文集中体现,此阶段成功鉴定和描述人类基因组中的功能元件。同时技术开发阶段的项目也获得了成功,改善了一些新技术,功能元件产生了高通量数据。此阶段NHGRI共投入经费约4 000万美元。 计划的第二阶段(2007年9月~2012年9,持续5年)。正由于该计划初始阶段两个项目的成功,2007年9月,为使ENCODE计划规模化,NHGRI投资新的项目,包括两部分,一部分是整个基因组的成果产出阶段项目(a production phase on the entire genome),另一小部分为区别初级阶段的中试规模的试验研究(pilot-scale studies)。正如前面的中试阶段项目,ENCODE的成果产出以开放式的联盟形式加以组织,包括具备多种学科背景和知识的专业研究人员和分析型数据库。这一成果产出阶段还将包括一个数据合作中心(Data Coordination Center)以便跟踪、存储和展示ENCODE的数据,同时利用数据合作中心来促进分析数据的整合。这一阶段总投入约为1.23亿美元。 截止这一阶段,如果将ENCODE计划相关的技术开发及模式生物研究而投入的1.25亿美元包括在内的话,NHGRI为该计划投入已接近3亿美元。 经过9年的努力,研究人员对至少147种细胞类型进行了分析。研究人员将从基因组中转录的RNA进行分离、测序,识别出约120种转录因子的DNA结合位点;还绘制了基因组中被甲基团覆盖的区域图;检验了组蛋白的化学修饰方式,这种修饰有助于将DNA包装成染色体,增强或抑制信号区(基因表达区),确定了400万个基因开关,明确了哪些DNA片段能打开或关闭特定的基因,以及不同类型细胞之间的“开关”存在的差异等超过15万亿字节的原始数据。这些研究成果证实所谓“垃圾DNA”都是十分有用的基因成分,担任着基因调控重任,约80%的基因组都具备某种功能,不过目前已经明确功能的占总量的10%左右。目前所有数据均全部公开(http://genome.ucsc.edu/ENCODE/),成为一个互动的百科全书,并可以免费公开获得和利用这些资料和数据。 计划的第三阶段(2012年9月下旬~)。有媒体推测此阶段还将获得1.23亿美元的资助。目前,已明确的是,NHGRI投入的第一笔经费是3 030万美元,为期4年,旨在对ENCODE项目已公布的人类全基因组图谱进一步完善:1)将选取更大数量的人体细胞和组织进行功能元件的鉴定,以获得一系列不同类型的更深层次的数据集;2)进一步分析小鼠基因组,目的是在利用人类不易获取的组织开展的研究中推广使用这种模式生物,并发掘比较基因组分析的潜力,以加大对人类基因组功能的理解;3)资助建立一个数据协调中心和一个数据分析中心,支持开发新的计算方法,改善对ENCODE数据的分析水平,提高这些数据对科学界及对人类生物学和疾病研究的实用性。 (未完待续) (游文娟 整理) |