所有分类
人体细胞中的DNA长2码(1.83米),包裹着数百万个珠状组蛋白,以适应细胞核内部。莱斯大学和贝勒医学院的研究人员表示,检查这些蛋白质的化学状态可以预测整个DNA染色体的折叠方式。
位于莱斯理论生物物理中心(CTBP)的研究人员构建了计算机模型,用于分析表观遗传标记,包括与DNA结合的蛋白质以及对组蛋白的化学修饰。他们收集了这些标记中编码的信息,以预测染色体在三个维度上的折叠方式。
他们的研究结果使遗传学领域更接近于预测整个基因组折叠结构的能力,这有朝一日可能有助于识别与错误折叠相关的遗传疾病。
这项工作本周出现在“美国国家科学院院刊”上。
DNA折叠成细胞核,折叠成不同类型细胞的功能形式。因为生物体中的每个细胞都含有相同的DNA,表观遗传标记有助于它找到适合它所栖息的细胞类型的形式。
“遗传密码之上的某些东西告诉细胞它应该是什么,并确定在任何给定时间将要读取染色体的哪些部分,”该论文的共同作者,生物物理学家Peter Wolynes说。“这些都是所谓的表观遗传标记。”
总的来说,表观遗传标记有助于将基因组打包到它在间期中采用的松散但高度组织的区室,即细胞生命中的工作“中年”。这些区室使转录相关基因紧密接近,使它们能够交流和发挥作用。
表观遗传标记可以通过称为ChIP测序的成熟技术揭示,该技术沿着DNA定位蛋白质结合位点。
“我们并不完全了解基因组是如何标记的,但我们可以通过ChIP测序来测量它,这已经成为一个相当简单的实验,”Wolynes说。“就像我们可以查看遗传密码(DNA)一样,我们也可以直接在许多不同的细胞中测量这些标记。它们已成为基因组中的下一层序列。”
“这是另一层信息,”共同作者兼生物物理学家JoséOnuchic说。“你的每个细胞的DNA都是一样的。然而,不同种类的细胞具有不同的表观遗传学,因此它们的表达模式是不同的。”
共同主要作者和赖斯博士后研究员Michele Di Pierro和Ryan Cheng使用ChIP测序数据检测人类淋巴母细胞,探测84种不同的DNA结合蛋白和11种组蛋白的化学修饰。组蛋白有助于通过充当DNA缠绕的线轴来组织基因组。
使用来自一些染色体的数据,他们训练了一个名为MEGABASE的定制神经网络(与结构集合相关的生物标记的最大熵基因组注释),以输出一系列染色质类型。他们说,这揭示了表观遗传标记与隔室的关系。经过训练,他们通过从剩余的染色体中提供数据来验证MEGABASE模型。这为Rice团队的MiChroM计划提供了一套新的结构类型,这是该实验室的AWSEM能量景观算法的表亲,该算法预测蛋白质的结构。MiChroM算法预测了染色体的三维结构。
“我们的研究结果支持这样的观点,即染色体中的区室化是由于细胞核中不同染色质类型的相分离,如油和水的分离,”Cheng说。
当研究人员将原始数据集缩小到11个组蛋白标记并再次进行计算时,结果只是略有不同。最终,他们确定单独的组蛋白数据足以预测染色体的形式。“有一个明确定义的代码将组蛋白标记连接到结构上,”Di Pierro说。“它很保守,所以很可能它有一个功能。”
为了验证他们的理论,研究人员将他们的结果与Hi-C产生的淋巴母细胞的接触图进行了比较。这项实验技术采用高通量测序技术鉴定DNA中的折叠模式,由贝勒中心基因组建筑中心主任,CTBP高级研究员Erez Lieberman Aiden共同开发。
“这篇论文说我们可以获取有关组蛋白的一维信息,并将其与我们的大数据工具一起用于预测三维结构,”Wolynes说。
他们的成功使团队更接近于预测整个基因组结构的理论的最终目标。然而,鸡蛋或鸡蛋问题仍然存在:染色质是否由于标记而折叠,或者由于折叠而出现标记?
“这是我们对生活如何运作的迷恋的一部分,”迪皮罗说。“这是一个美丽的问题。”
上一篇:老年DNA可能以不同方式激活基因
我要评论