所有分类
几个世纪以来,甘蔗为人类社会提供了酒精,生物燃料,建筑和编织材料,以及世界上最依赖的糖源。现在,研究人员从甘蔗中提取了一个甜蜜的科学奖:它庞大而复杂的基因组序列,这可能会导致更强壮和更高产的品种的发展。
制作全面的序列需要来自16个机构的100多名科学家的共同努力; 这项工作花了五年时间,最终出版了Nature Genetics的出版物。但是,解决这个项目的动机早就出现了。
“就个人而言,我等了20年才对这个基因组进行测序,”伊利诺伊大学植物生物学教授雷明说,他煽动并领导了测序工作。“当我在20世纪90年代后期研究甘蔗基因组图谱时,我梦想有一个甘蔗的参考基因组。” Ming是Carl R. Woese基因组生物学研究所的成员,该研究所是一群研究甘蔗和相关作物以促进食品和生物燃料生产的研究人员之一。
在全基因组序列是值得等待的,并由于其潜在的努力,以帮助改善甘蔗的努力。大多数农民种植的甘蔗是两种物种的混合物:甘蔗(Saccharum officinarum),其生长具有高糖含量的大型植物;以及甘蔗自发体,其较小的尺寸和甜度被增加的抗病性和对环境胁迫的耐受性抵消。由于缺乏完整的基因组序列,植物育种者通过几代杂交和选择产生了高产,强壮的菌株,但这是一个依赖时间和运气的艰难过程。
“甘蔗是第五大最有价值的作物,缺乏参考基因组阻碍了甘蔗改良的基因组研究和分子育种,”Ming说。“......测序技术还没有准备好处理大型同源多倍体基因组,直到2015年第三代测序技术的吞吐量,读取长度和成本[例如生物技术公司Pacific Biosciences开发的]变得足够具有竞争力。”
为什么对甘蔗基因组进行测序如此困难?植物中常见的自然现象造成了重大的技术障碍。在甘蔗的进化历史中的某个时期,它的基因组被重复了两次,导致每对染色体的四个略有不同的版本都挤在同一个核心中。
这些事件不仅使基因组的大小增加了四倍(因此DNA序列的体积也很大),它们也使得基因组范围内的重复序列高度相似,更难以组装成不同的染色体。基因组DNA通常以小的重叠片段进行测序或读取,来自这些片段的序列数据变成巨大的线性拼图的重叠片段。随着甘蔗基因组大小翻倍,再次翻倍,这个难题不仅变得更大; 它采用了重复但不完全相同的元素,许多小块很难正确地适应这些元素。
为了克服这一挑战,测序团队使用了一种称为高通量染色质构象捕获或Hi-C的技术。这种方法使研究人员能够发现染色体DNA长而缠结的部分哪些部分在细胞内相互接触。当使用由团队开发的称为ALLHIC的定制算法进行分析时,得到的数据用于拼图拼图盒盖上的图片的目的,提供粗略地图,其中序列的哪些部分最可能属于哪个染色体。
“最大的惊喜是,通过结合长序列读数和Hi-C物理图谱,我们将同源四倍体[四倍]基因组组装成32条染色体,并实现了同源染色体中等位基因特异性注释的目标,”Ming说。换句话说,研究人员现在知道哪些基因序列属于原始的重复前基因组中的四种变异中的每一种 - 比他们预期的更高水平的细节。
有了这些信息,研究人员可以形成关于甘蔗基因组进化史的奥秘的更好假设。
通过与相关物种的基因组进行比较,研究人员知道,在某些时候,独特染色体的数量已经从10个减少到8个。令团队惊讶的是,新的序列数据显示两条不同的染色体已经分开,然后所有四个半部分都融合到不同的现有染色体上,这是一组比它们假设的更复杂的事件。
理解这些物理变化有何帮助?随着基因组内的这些大的物理重排,受影响区域中的基因发生变化。例如,Ming和他的同事们发现,移植到新位置的大块染色体含有更多的基因,这些基因可以帮助植物抵抗疾病,而不是其他地方。
“它解决了一个谜,为什么S. spontaneum是如此优越的抗病和抗逆基因来源,”Ming说。“染色体重排可能是原因,而不是这种富集的结果,尽管这种富集的强调机制仍有待研究。这一发现将加速挖掘已经融入优良现代甘蔗杂交品种的抗病基因的有效等位基因,以及随后实施分子育种[甘蔗]。“
高质量的基因组序列也使研究人员能够确定现代甘蔗令人难以置信的甜味的可能来源:即使在甜度较低的S. spontaneum中,也会产生多个糖基转运基因拷贝的突变。他们还能够观察到,在S. officinarum和S. spontaneum之间的杂交中,来自S. spontaneum的DNA序列在整个杂交基因组中随机分散。
“ALLHIC方法已被证明对构建同源多倍体甘蔗基因组有效,”Ming说。他预计成功用于甘蔗 基因组的技术也将有助于研究人员对其他复杂基因组进行测序。
上一篇:科学家研究非洲猪瘟以防止美国爆发
我要评论