据新华社北京7月19日电 燕麦作为六倍体作物具有基因组大、重复序列含量高等特点,其基因组测序组装一直是世界性难题。日前,我国科学家在裸燕麦基因组研究方面取得重大进展,破译了起源于我国并广泛种植的六倍体裸燕麦基因密码,打开了裸燕麦基因组大门。7月18日晚,国际知名学术期刊《自然·遗传学》在线发表了研究论文《基于参考基因组揭示六倍体燕麦的起源和进化》。
燕麦依种子带壳与否,分为皮燕麦和裸燕麦两大类型,相比于皮燕麦,裸燕麦加工更加简单,我国主要种植的是裸燕麦,主产区集中在内蒙古、河北、山西等地。据国家燕麦荞麦产业技术体系首席科学家、吉林省白城市农业科学院研究员任长忠介绍,现有的栽培燕麦已经在漫长进化过程中自然杂交和加倍,从二倍体形成四倍体,最终多倍化为含有A、C和D三个基因组的六倍体。因此,裸燕麦基因组由约110亿个碱基对组成,分布在细胞核3个亚基因组的21对染色体中。其基因组庞大而复杂,体量约为水稻基因组的40倍,且有约87%的基因组DNA为重复序列,致使其基因组测序组装研究非常困难。
在本项研究中,任长忠研究员领衔的以四川农业大学和吉林省白城市农业科学院为核心的燕麦联合研究团队选择了我国裸燕麦起源中心的燕麦品种为材料,针对六倍体燕麦亚基因组构成及其高重复序列含量导致基因组装中可能遇到的问题,设计了选用可进行更长DNA片段高精确度测序的超长测序技术,并利用团队近20年的燕麦属物种研究经验积累,选择了栽培燕麦最可能的四倍体和二倍体祖先,结合HiC、二代测序、全长转录组测序和转录组测序等不同技术手段,最终完成了中国六倍体裸燕麦的染色体组装、挂载和注释,获得了裸燕麦的高质量参考基因组。