四核苷酸重复序列恒温扩增特性及基因组中反向重复序列特点的研究
简单重复序列广泛存在于多种生物基因组中,同分子进化、基因调控和某些遗传疾病密切相关,广泛用作遗传标记和遗传作图,其生物学意义越来越受到人们的重视。研究显示,许多简单重复序列(包括四重复序列)易于扩增变长,某些重复序列的异常延伸是造成一些遗传疾病的直接原因。然而,对四重复序列扩增特性和机理的研究报道很少。为系统研究其扩增特点,本研究首先选取了有代表性20 nt的60种四重复和6种二重复单链,综合探究了它们在嗜热DNA聚合酶作用下等温扩增的特点。探讨了反应温度、对应双链模板的Tm、时间、序列、浓度、酶种类等因素对扩增特点和产物长度的影响。此外,还对非回文单链中部分回文序列对扩增的影响和某些五、六、七、八重复单链序列的扩增特点进行了简单分析。接下来,以互补非回文四重复单链混合成的双链和回文序列为对象,简单分析了重复双链扩增的特点。最后,受反向重复序列(Inverted Repeat,IR;Inverrted Repeats,IRs)极大提高重复单链扩增能力的启示,利用Matlab编写IR搜索程序然后,搜索了某些病毒、大肠杆菌和酿酒酵母基因组序列和人部分染色体片段中的IR,对其特点进行了分析。 四重复单链扩增结果显示:多数单链模板能扩增变长,即使链内没有互补碱基的序列也可被扩增,如(AGGA)5;非回文单链产物呈弥散条带,回文单链在某些条件下产物分子量比较集中;回文单链扩增强于非回文单链,前者初始扩增就很快,后者先慢后快;二重复单链比相同碱基组成的四重复单链有更宽的适于扩增的温度范围;G和C含量多的单链较G和C含量少的序列更易扩增,而且G和C含量越多越适于在较高的温度下扩增;重复单位含两相同嘧啶的链多数比其互补链更易扩增;70℃下产物浓度与时间基本呈线性关系。非回文四重复单链在10 nM以上才会在16 h内有明显扩增,而回文序列在低至10 pM时仍能在短时间内明显扩增;常温聚合酶Klenow片段不能有效扩增四重复序列,而嗜热聚合酶的扩增活性具有序列偏好性;四重复单链的有效扩增需要在一定的酶浓度之上,回文序列的必须酶浓度更低。互补序列加入非回文四重复单链后扩增能力得到极大提高,在3’端易生成小分子,在5’端则易生成大分子。五、六、七、八重复单链的扩增结果显示:回文单链的扩增能力依然很强,非回文单链的扩增普遍较弱;重复单位与回文序列仅差1个碱基的非回文序列扩增能力极大减弱;重复单位中相同的碱基变化对不同序列的影响不同。限制性酶切产物结果显示,扩增产物与模板具有相同的重复单位,是重复序列的简单延伸。最后,根据实验结果和相关文献,提出了链内滑动扩增和发卡DNA介导扩增两阶段的重复序列单链扩增模型,以对重复序列非特异扩增和相关疾病发生机制的研究提供参考。 四重复双链的扩增结果显示:二重复非回文双链比绝大多数四重复非回文双链扩增更强,且产物长度随时间增加的趋势更明显;重复序列双链比相应的单链在短时间(3 h)内的扩增更快;四重复双链产物也呈弥散条带,某些产物长度随时间递增;双链模板的最适扩增温度与其Tm相近,故含GC多的最适扩增温度更高;G-C在双链中的分布影响序列的扩增能力;相同碱基组成的模板具有相似的扩增特点,如产物浓度随时间的变化趋势。聚合酶对序列也有偏好性,且嗜热聚合酶比常温聚合酶(Klenow)对模板的扩增活性更高。扩增产物是与双链模板具有相同重复单位的串联重复序列。 最后,用编写的程序对某些病毒、大肠杆菌和酵母基因组及人部分染色体片段序列中的IR进行了搜索,具体以序列长度(L)、IR数目(N)及密度(pN)、完配IR数目(mN)及比例(rmN)、IR两端间隔(G)、IR臂长(A)、臂长中互补部分比例(rmA)及互补碱基对中的A-T比例(mrAT)等为指标进行统计分析。病毒组各项指标变化较大:IR密度0.003-0.017、完配IR比例0.17-0.64、两端间隔22.0-42.2、臂长8.8-18.8、匹配碱基对中A-T比例0.16-0.81。这从侧面反映了不同病毒为了适应各自环境而获得了显著不同的基因组序列。不同大肠杆菌菌株染色体的各项IR指标具有一致性:IR密度相对较小(0.008),臂长较短(11.0)、配对碱基对中A-T相对较少(0.51)。而其质粒比染色体具有相对较大的IR密度(0.01)、完配IR比例(0.48)和匹配碱基对中的A-T比例(0.55)。酵母各染色体指标几乎相同,如间隔略大(37.0)、配对碱基对中A-T更多(0.72)。酵母线粒体的具有鲜明的特点:IR密度很大(0.04),平均每25个碱基就会有一个IR;完配IR的比例(0.14)和两端间隔较小(25.0)但臂长更长(33.1),臂的匹配部分更小(0.84),匹配碱基对中A-T更多(0.94)。由于选取的随机性,人的各染色体片段的各指标具有一定的跨度,平均来看:IR密度略大(0.01)、完配IR相对略少(0.42)、IR两端间隔较小(34.7)、IR臂偏长(多数在12以上),臂的匹配碱基对中A-T较多(0.63)。特别的,第4、8、12、13尤其22号染色体片段中含有很多臂长在200 bp以上的IR。多数实验序列比同碱基组成的随机序列含有更多的IR,而某些病毒倾向于含有更少的IR。多数序列IR随间隔的分布与随机序列具有显著的差异,这应该受到了总IR数差别的影响,同时也是生物序列中IR特点的突出表现。 前两部分实验希望为重复序列的体外扩增特性和机理的研究提供材料。通过搜索某些基因组中的 IRs,希望能为生物基因组中序列组成和 IR存在状态的研究有所帮助,进一步揭开某些序列体内异常扩增的秘密。
四核苷酸;重复序列;恒温扩增特性;基因组;染色体
中国海洋大学
硕士
食品科学
梁兴国
2014
中文
Q786
113
2015-04-01(万方平台首次上网日期,不代表论文的发表时间)