海带线粒体及部分核基因组结构特征研究
海带是一种冷水性大型经济海藻,具有重要的经济价值,可作为食品、化工原料、保健产品、生物肥料等。另外,海带生物量巨大,是太平洋和大西洋暖温带海域潮下带的重要初级生产力,在近海生态系统中占据重要的生态地位。海带生活史中特征性的异型世代交替现象使之成为了藻类学和遗传学研究的典型生物。
海带栽培在我国海水养殖业中占据极其重要的地位,我国海带养殖面积、养殖产量均居世界首位。与海带栽培业相比,海带分子水平的基础理论研究相对落后,海带基因组信息知之甚少,使海带研究缺乏较为全面的遗传背景信息,目前尚无法深入阐明海带的遗传机制与机理,也限制了多项工作的开展。鉴于此,开展海带基因组的研究显得迫在眉睫。
本论文首次针对海带线粒体及核基因组的结构特征进行探讨,研究内容包括了两部分:一是利用逐段扩增的方式扩增并测定了“荣福”海带(Laminariajaponica×Laminaria saccharina)、长叶海带(Laminaria longissima)、极北海带(Laminaria hyperborean)的线粒体全序列,结合公共数据库中海带属线粒体DNA(mitochondrion DNA,mtDNA)数据,探讨海带属线粒体DNA结构特征,并首次在线粒体基因组水平上探讨海带属的分类地位及系统发育关系;二是首次利用高通量测序技术对“荣福”海带基因组进行随机测序,在此基础上分析重复序列在海带基因组中的组成和分布特征,为大规模高效开发具有多态性的微卫星等分子标记提供借鉴。主要研究结果如下:
(一)线粒体基因组的结构特征及系统进化分析
测定了“荣福”海带、长叶海带、极北海带3种海带的线粒体全序列,其序列长度分别为37,638 bp、37,628 bp、37,976 bp。编码66~67个基因(极北海带67个),其中38~39个蛋白编码基因(极北海带39个)、3个核糖体RNA基因(rRNA)、25个转运RNA基因(tRNA)。
海带属线粒体基因组的基本结构特征:基因排列紧凑,基因间隔区较短,除掌状海带(Laminaria digitata)和极北海带有ORF157基因的插入外,基因数目及排列方式完全一致,未发生基因重排现象;在碱基组成方面,海带属的mtDNA全序中A+T含量丰富,均占65%左右,且主编码链呈现G偏倚现象;在密码子使用上,海带属藻类均使用通用遗传密码,除了掌状海带和极北海带的ORF157基因以GTG为起始密码子,其它基因的起始密码子均为标准起始密码子ATG,终止密码子出现了TAA,TAG,TGA三种类型,且更偏向于使用TAA,同义密码子的使用与密码子第三位点的碱基组成密切相关。
首次发现相对真海带(Laminaria japonica)线粒体基因组,“荣福”海带在rps3和rps9基因之间的非编码区缺失了19个碱基,进一步研究我国7个主要养殖品种和种群发现,根据这一非编码区的有无可将其划分为2个类群,“荣福”、“三海”、“福建”海带均存在这一非编码区的缺失,“爱伦湾”、“东方2号”、“东方3号”、“早厚成”海带则具备这一非编码区,因此该变异可以作为海带种质亲缘鉴定的依据。
结合目前已获得的海带属线粒体基因组数据,分别利用30个蛋白编码基因联合序列及rRNA基因联合序列进行海带属系统发育树的重建,结果显示:海带属藻类聚为两支,掌状海带和极北海带聚为一支,另外一支包括狭叶海带(Laminaria angustata)、革质海带(Laminaria coriacea)、鬼海带(Laminariadiabolica)、真海带、长叶海带、长柄海带(Laminaria longipedalis)、利尻海带(Laminaria ochotensis)、皱海带(Laminaria religiosa)和“荣福”海带。其聚类结果与海带外部形态特征及地理分布相吻合。
(二)核基因组的串联重复序列分析
首次将新一代高通量测序技术(454 GS FLX Titanium)应用于海带基因组研究。对构建的基因组文库进行了随机测序,序列经拼接后得到了18,051条非冗余序列,序列总长为9,397,460 bp,约占海带基因组的1.33%。
对海带核基因组的串联重复序列进行统计分析,发现的串联重复序列共计1782条,长度累计为100,320 bp,占测序总长的1.00%。其中微卫星序列770条,小卫星序列992条,卫星序列20条,分别占串联重复序列总数的43.21%,55.67%,1.13%。
微卫星序列在海带基因组中的分布特征如下:平均每12 kb出现一个微卫星序列;重复单位长度与拷贝数呈中度负相关(γ=-0.719);微卫星序列各重复类型的丰度存在着规律性的分布特征:一、三、五由质数数目组成的重复类型其重复序列数目分别高于两侧重复类型为二、四、六偶数的重复序列数目;三碱基重复微卫星序列是海带基因组中的优势重复类型,重复序列数目占微卫星序列总数的32.21%,且三碱基重复是可以作为分子标记的微卫星序列中多态性最高的重复类型;海带基因组微卫星序列为富含AT的序列,A+T含量大于50%的共计有582条,占微卫星序列总数的75.58%。
小卫星序列在海带基因组中的分布特征如下:平均每9 kb出现一个小卫星序列,其丰度较微卫星的高,且长度为26 bp的重复单位序列数量最多,占小卫星序列总数的9.07%;在小卫星序列中,随着重复单位长度的增加,其所对应的重复序列数目呈递减趋势:海带基因组小卫星序列重复单位拷贝数主要集中在低拷贝区(2~12个拷贝);海带基因组小卫星序列为富含AT的序列,其A+T含量大于50%的序列计有741条,占小卫星序列总数的74.70%。
本研究所进行的mtDNA基因组全序列的结构特征及系统进化分析、海带核基因组重复序列组成与结构特征分析,为海带基因组学研究提供了最为直接的信息,同时也为海带的遗传学研究和实践应用奠定了良好的基础。
海带;线粒体基因组;核基因组;结构特征;系统进化;重复序列
中国海洋大学
博士
细胞生物学
张志峰;刘涛
2011
中文
S985.41
134
2011-10-31(万方平台首次上网日期,不代表论文的发表时间)