1.2.2 用实验方法证实 可以通过引物延伸法确定5'端和3'端的长度,如:5'端 RACE,3'端 RACE,或者通过 Northern Blot 证实大小是否一致。 1.3 对 cDNA 文库的分析 对 cDNA 文库质量的评价主要有两个方面。第一方面为文库的代表性,cDNA 文库的代表性是指文库中包含的重组 cDNA 分子反映来源细胞中表达信息(即 mRNA 种类)的完整性,它是体现文库质量的最重要指标。文库的代表性好坏可用文库的库容量来衡量,它是指构建的原始 cDNA 文库中所包含的独立的重组子克隆数。库容量取决于来源细胞中表达出的 mRNA 种类和每种 mRNA 序列的拷贝数,1个正常细胞含10000~30000种不同的 mRNA,按丰度可分为低丰度、中丰度和高丰度三种,其中低丰度 mRNA 是指某一种在细胞总计数群中所占比例少于0.5%时。满足最低要求的 cDNA 文库的库容量可以用 Clack-Carbor 公式 N=Ln(1-P)/(1-1/n) 计算( P 为文库中任何一种 mRNA 序列信息的概率,通常设为99%;N 为文库中以 P 概率出现细胞中任何一种 mRNA 序列理论上应具有的最少重组子克隆数;n 为细胞中最稀少的 mRNA 序列的拷贝数;T 为细胞中表达出的所有 mRNA 的总拷贝数)。第二方面是重组 cDNA 片段的序列完整性。在细胞中表达出的各种 mRNA 片段的序列完整性。在细胞中表达出的各种 mRNA 尽管具体序列不同,但基本上都是由3部分组成,即5'端非翻译区,中间的编码区和3'端非翻译区。非翻译区的序列特征对基因的表达具有重要的调控作用,编码序列则是合成基因产物—蛋白质模板。因此,要从文库中分离获得目的基因完整的序列和功能信息,要求文库中的重组 cDNA 片段足够长以便尽可能地反应出天然基因的结构。 2 cDNA 文库构建的其它类型 2.1 均一化 cDNA 文库 它是指某一特定组织或细胞的所有表达基因均包含其中,且在 cDNA 文库中表达基因对应的 cDNA 的拷贝数相等或接近。WEISSMAN 早就提出了可以通过基因组 DNA 饱和杂交的原理将 cDNA 文库进行均一化的理论。但该理论一直以来都被认为不能应用于实际。其主要限制因素是难以提供足量的极低表达丰度的 cDNA 用于饱和杂交,从而可能会造成部分基因的 cDNA 的丢失。20年前,基于 DNA-RNA 杂交的研究就已经将基因的转录水平分为高中低3类。随后研究进一步表明,绝大多数基因是处于中等或低等表达丰度的,在单个细胞中含有近1~15个拷贝,而高丰度表达基因的转录产物在单个细胞中最高可达5000个左右拷贝,约占总表达量的25%。这种基因表达能力上的巨大差异成了获得一个具有完整代表性的 cDNA 文库的障碍,其表达量上的巨大差异更为大规模研究增添了困难。对单一组织的 cDNA 文库而言,高拷贝基因序列的大量存在给基因的筛选和鉴定带来不必要的浪费,尤其是在大规模的 EST 测序中。 均一化 cDNA 文库是克服基因转录水平上巨大差异给文库筛选和分析带来障碍的有效措施,有利于研究基因的表达和序列分析。现在,在构建均一化的 cDNA 文库中至少有2种主要的观点:一种是基于复性动力学的原理,高丰度的 cDNA 在退火条件下复性的速度快,而低丰度的 cDNA 复性要很长时间,从而可以通过控制复性时间来降低丰度;另一种是基于基因组 DNA 在拷贝数上具有相对均一化的性质,通过 cDNA 与基因组 DNA 饱和杂交而降低在文库中高拷贝存在的 cDNA 的丰度。第一种方法的掌握对技术的要求比较高,对多数人而言需要多次摸索才能找到最适条件;而后一种方法易于掌握,但有研究者根据复性动力学的原理也提出了其不利因素,即采用基因组 DNA 饱和杂交的方法会因为低拷贝的表达基因拷贝数少而无法被杂交上。目前已报到的均一化 cDNA 文库多是根据第二种原理构建的,常用策略有基于 PCR 技术利用 cDNA 多次复性 mRNA-cDNA 杂交等。有研究报道,针对各自选择的高表达靶序列进行分析后,均一化处理后文库的高丰度表达 cDNA 是处理前的0.3%~2.5%,基本满足节约筛选的要求。 均一化 cDNA 文库具有以下4方面的优点:第一,在经济上具有广泛的应用空间,可以节约大量试验成本。第二,增加克隆低丰度 mRNA 的机会,适用于分析各种发育阶段或各种组织的基因表达及突变检测。第三,与原始丰度的 mRNA 拷贝数相对应的 cDNA 探针与均一化的 cDNA 文库作杂交,可以估计出大多数基因的表达水平及发现一些组织特异的基因。而以往的文库构建,忽略了 mRNA 丰度的影响。第四,可以用于遗传图谱的制作和进行大规模的原位杂交,作为优化的文库系统还可以用于大规模的测序或芯片制作等研究。 (责任编辑:泉水) |