所有分类
今天,数以千计的具有生物数据的数据库是公开的。它们包括基因和蛋白质序列的数据以及不同细胞参数的详细测量,例如在各种实验条件下由给定细胞产生和降解的所有蛋白质的确切量。巴西研究人员探索了mRNA和蛋白质公共数据库,并发现基因序列选择如何预测蛋白质合成的不同方面,如蛋白质生产效率。该研究发表在Nucleic Acids Research上,可以帮助开发基因和蛋白质的新生物技术应用。
包含在细胞核中的DNA 被复制在信使RNA(mRNA)中。与DNA不同,mRNA是离开细胞核并被核糖体翻译的动态和不稳定分子,核糖体是将RNA(和DNA)转化为形成蛋白质的氨基酸序列的核苷酸序列转化的分子机器。每个氨基酸对应于三个核苷酸或密码子的一种或多种组合。因为相同的氨基酸可以从不同的密码子翻译,遗传密码被描述为简并(或冗余)。
尽管可以从替代基因序列产生相同的蛋白质,但是一些组合导致更高的蛋白质产量。另外,最佳密码子和非最佳密码子可分别降低或增强mRNA降解。研究小组已经测量了mRNA的产生和降解速率,但令人惊讶的是,数据存在许多偏差。
巴西科学家合成了明显不同的数据,并扩展了基因序列选择如何预测蛋白质合成方面的知识,如mRNA稳定性和生产效率。由里约热内卢联邦大学的Fernando Palhano和Tatiana Domitrovic领导的一个研究小组使用来自mRNA密码子组成的度量来比较现有数据与不同的细胞参数。他们发现该指标与蛋白质丰度和蛋白质生产效率相关,表明最连贯的mRNA衰变数据集。他们的工作重申,mRNA降解在某种程度上与蛋白质生产效率有关。“即使在特定条件下需要高水平的蛋白质,例如应激反应,其基因序列也经过优化,无法有效翻译。”
Fernando和Tatiana与Rodolfo Carneiro和其他同事合作,他们鉴定了一组由非最佳密码子编码的低丰度蛋白质。正如他们在Nucleic Acids Research发表的论文中所表明的那样,密码子的选择不仅对保证高蛋白质产量至关重要,而且对于调节应以最小量产生的蛋白质(如调节蛋白质)的产量至关重要。
“细胞中产生的蛋白质含量对于维持整体健康至关重要 - 许多人类疾病是由蛋白质生成效率低下或不平衡引起的,如囊性纤维化和癌症,”塔蒂亚娜说。“从实践的角度来看,了解基因序列和蛋白质生产之间的关系可以对医学和生物工程产生深远的影响。”
作者指出,许多“沉默的”DNA突变,即改变密码子序列但不改变编码氨基酸的突变,可导致蛋白质产生率的显着改变,这可能导致疾病。通过仔细选择基因序列,科学家们可以微调蛋白质的产生,促进基因和蛋白质的生物技术应用。
这篇名为“密码子稳定系数作为衡量mRNA稳定性和密码子偏倚及其与翻译关系的指标”的论文在线发表在Nucleic Acids Research上。
我要评论