|
小麦基因组研究取得重大突破
普通小麦是一个 AABBDD 的异源六倍体,其形成涉及 3 个原始祖先物种和 2 次天然杂交。大概 50 万年前,祖先种乌拉尔图小麦(Triticum urartu)和近缘种山羊草杂交加倍后形成异源四倍体 AABB。大概 8 000—10 000 年前,这个异源四倍体又与野生粗山羊草杂交加倍后才产生了 AABBDD 的异源六倍体,这导致普通小麦的基因组庞大而复杂。由于水稻和玉米相对简单的基因组较早被破译,已经使得二者的分子设计育种理论和技术日趋完善。鉴于此,高质量小麦参考基因组序列图谱是小麦分子设计育种研究取得突破性成果的关键。
我国在麦类作物基因组研究方面作出了很多突出贡献,包括 AA 基因组和 DD 基因组的精细图谱绘制,以及参与了“中国春”AABBDD 六倍体小麦精细图谱的部分绘制工作。其中,A 基因组是小麦进化的基础性基因组,在多倍体小麦进化过程中起着核心作用。中国科学院遗传与发育生物学研究所(以下简称“遗传发育所”)小麦研究团队利用二代测序技术对乌拉尔图小麦进行了全基因组测序,于 2013 年完成了小麦 A 基因组草图的绘制。注释出了 34 879 蛋白编码基因,预测出了 1.6 万多个简单重复序列(simple sequence repeat,SSRs)、73.9 万多个插入位点的多态(insertion site-based polymorphism,ISBPs)和 340 多万个单核苷酸多态(single nucleotide polymorphism,SNP)分子标记,相关研究结果发表在 Nature 杂志上。之后,团队成员构建了二倍体乌拉尔图小麦 A 基因组的 BAC 文库和物理图谱,通过 BAC-by-BAC 测序,并结合三代 PacBio 测序和最新基因组物理图谱构建等技术(10×Genomics,BioNano),完成了小麦 A 基因组的精细图谱绘制。基因组大小为 4.94 Gb,组装的 Contig(无N)序列总长为 4.79 Gb(为基因组的 97%),Contig N50 为 344 kb;Scaffold(含 N)序列总长为 4.86 Gb(为基因组的 98.4%),Scaffold N50 为 3.67 Mb。注释出了 4 1507 个蛋白编码基因,81.42% 的基因组序列为重复序列。通过比较基因组学研究,鉴定出了小麦 A 基因组在进化过程中发生结构变异,并演绎出了小麦 A 基因组 7 条染色体的进化模型,为小麦进化分析和基因克隆提供了一个高质量的参考基因组。相关研究结果发表在 2018 年 Nature杂志上。
此外,美国的研究团队利用经典的 BAC-by-BAC 测序结合 Bionano 和三代测序技术,中国农业科学院贾继增团队采用二代结合三代测序技术和 NRgene 组装技术,分别绘制完成小麦 D 基因组供体粗山羊草(Aegilopst auschii)的参考基因组精细图谱,研究结果分别发表在 2017 年的 Nature 和 Nature Plant杂志上。与此同时,小麦四倍体祖先种野生二粒小麦(Triticum dicoccoides)的 AABB 基因组序列解析结果发表在 Science 杂志上。尤其重要的是,国际水稻测序联盟采用流式细胞仪分离技术将普通小麦“中国春”(Chinese Spring,CS)的染色体进行分离,利用二代测序和 NRgene 组装技术分染色体解析注释了 CS 的参考基因组序列并公开释放(RefSeq-v1.0)。这应该是目前小麦染色体级别组装最好的版本。
截至 2018 年 8 月,六倍体小麦及其亲缘种 AA、DD、AABB 和 AABBDD 的精细基因组序列图谱均已绘制完成,这为小麦的功能基因组学、比较基因组学和进化基因组学研究奠定了基础;尤其在全基因组水平上认识小麦的起源、驯化、人工选择以及重要农艺性状形成的遗传和表观遗传调控机制,挖掘优异等位基因并利用于育种,对保障我国粮食安全和农业可持续发展意义重大。