在从临床样本出发的研究中,我们常常碰到这样的情况:某个基因的突变位点(或者SNP,在后文中统一用突变表示)与疾病进展有显著相关性,在分子机制研究的五个层次,你的研究在哪个层次?我们说第一层相关性是比较弱的逻辑关系,基因突变与疾病进展两个因素之间有相关性,基因突变可能是疾病进展的原因(“Driver” mutation)或者结果。
我们知道当基因突变发生在编码区,并且由于突变导致编码蛋白序列产生差异,从而导致疾病进展是完全可以解释,并有成熟研究套路的。理论基础比较简单:序列改变结构,结构改变功能,功能异常导致疾病。为了证明中间的因果关系,一般需要结合生物信息学预测(核酸序列改变如何改变蛋白序列、蛋白二级、三级结构)、功能实验(从体外细胞和体内动物水平对基因序列进行干预,并进行疾病对应的表型和指标检测)和分子实验(蛋白序列结构的改变导致疾病相通路和分子异常)来阐述。这一点大家应该可以理解。
但是如果基因突变的位点正好在基因非编码区,或者在编码区却没有改变蛋白的序列(比如氨基酸密码子的简并性:比如ACU,ACC,ACA,ACG都是苏氨酸的密码子),临床统计结果强烈提示两者有相关性,而功能实验也确实证明了这个位点影响了细胞与动物表型,那机制该怎么解释呢?
个人认为解释这种构突变和疾病进展的一个关键词就是:结合,就是说即使蛋白序列没有变化,只要该位点的变化导致了与之结合的分子功能异常即可,这里的结合分子可以是蛋白、RNA或者DNA。
上面的内容大家看起来可能有些空洞,我们展开来说明:
以肿瘤为例,正常情况下癌基因A的mRNA被microRNA B结合和降解,我们知道microRNA与mRNA结合一般是mRNA的3'UTR区(对应microRNA的“种子”区),当突变位点坐落于这个位置时,本来是A的序列变成了G,导致microRNA与mRNA的结合受阻,癌基因A mRNA被降解减少,表达上调,肿瘤发生。
这个例子说明的是突变位点影响到了RNA与RNA的结合。
比如:转录因子TF通过促进抑制癌基因B的转录抑制肿瘤发生,这个过程要求转录因子TF首先结合到基因B DNA上的一段序列上(转录因子结合位点,图中的CATA),如果突变位点正好位于转录因子结合位点上(上图中的红色A变为了T),这时转录因子与序列的结合就会变弱;甚至当A变为了C,而胞嘧啶C又进一步被甲基化变为Cm后,可能转录因子与新序列CCmTA的结合就会被完全阻断;最终结果是抑癌基因B转录被抑制,肿瘤发生。
这个例子说明的是突变位点影响到了蛋白与DNA的结合。
关于可变剪接我们以前介绍过很多,一个基因的pre-mRNA经过剪接这个步骤会产生多条成熟的mRNA,而不同的mRNA功能可能类似,比如活性有高有底,也有可能完全相反。另外我们知道最近比较热的一类非编码RNA——环状RNA,也可能被剪接出来,比如正常情况下剪接出mRNA,疾病情况下剪接出circRNA。
这里我们考虑一个比较极端的例子:基因A的两条转录本A1和A2的功能是完全相反的,比如A1是癌基因,A2是抑癌基因。那么正常情况下A2起主导作用,而突变位点正好影响到了可变剪接这个过程,从而导致A2不再产生,而A1却被大量剪接出来,导致肿瘤发生。
这个例子说明的是突变位点影响到了蛋白与RNA的结合。
举了上面三个例子,我想大家应该能想到这点:当突变位点不能导致蛋白序列发生变化时,仍然可以从RNA或者DNA水平说明突变位点所造成的影响。
lncRNA-mRNA的结合,从而影响mRNA的稳定性;
lncRNA对DNA的结合,影响基因的表观调控;
lncRNA对RNA结合蛋白(RBP)的结合;
RNA的二级结构;
RNA的定位等等。
最后需要说明一点:在很多情况下,单个碱基的改变并没有什么用,对影响分子之间的结合起效甚微,所以在做机制前一定要先做功能实验证明。
我们知道当基因突变发生在编码区,并且由于突变导致编码蛋白序列产生差异,从而导致疾病进展是完全可以解释,并有成熟研究套路的。理论基础比较简单:序列改变结构,结构改变功能,功能异常导致疾病。为了证明中间的因果关系,一般需要结合生物信息学预测(核酸序列改变如何改变蛋白序列、蛋白二级、三级结构)、功能实验(从体外细胞和体内动物水平对基因序列进行干预,并进行疾病对应的表型和指标检测)和分子实验(蛋白序列结构的改变导致疾病相通路和分子异常)来阐述。这一点大家应该可以理解。
但是如果基因突变的位点正好在基因非编码区,或者在编码区却没有改变蛋白的序列(比如氨基酸密码子的简并性:比如ACU,ACC,ACA,ACG都是苏氨酸的密码子),临床统计结果强烈提示两者有相关性,而功能实验也确实证明了这个位点影响了细胞与动物表型,那机制该怎么解释呢?
个人认为解释这种构突变和疾病进展的一个关键词就是:结合,就是说即使蛋白序列没有变化,只要该位点的变化导致了与之结合的分子功能异常即可,这里的结合分子可以是蛋白、RNA或者DNA。
上面的内容大家看起来可能有些空洞,我们展开来说明:
1. 突变位点位于mRNA 3'UTR区,影响microRNA对其结合,导致mRNA 降解受阻,mRNA表达上升。同样这种模式也适用于lncRNA。
以肿瘤为例,正常情况下癌基因A的mRNA被microRNA B结合和降解,我们知道microRNA与mRNA结合一般是mRNA的3'UTR区(对应microRNA的“种子”区),当突变位点坐落于这个位置时,本来是A的序列变成了G,导致microRNA与mRNA的结合受阻,癌基因A mRNA被降解减少,表达上调,肿瘤发生。
这个例子说明的是突变位点影响到了RNA与RNA的结合。
2. 突变位点位于转录因子的结合位点,从而导致转录因子不能(或者减弱)参与基因转录调控。这里突变包括胞嘧啶C的出现或者以及胞嘧啶C的进一步甲基化修饰影响转录因子的结合。
比如:转录因子TF通过促进抑制癌基因B的转录抑制肿瘤发生,这个过程要求转录因子TF首先结合到基因B DNA上的一段序列上(转录因子结合位点,图中的CATA),如果突变位点正好位于转录因子结合位点上(上图中的红色A变为了T),这时转录因子与序列的结合就会变弱;甚至当A变为了C,而胞嘧啶C又进一步被甲基化变为Cm后,可能转录因子与新序列CCmTA的结合就会被完全阻断;最终结果是抑癌基因B转录被抑制,肿瘤发生。
这个例子说明的是突变位点影响到了蛋白与DNA的结合。
3. 突变位点影响到可变剪接过程,从而调控不同转录本的平衡;
关于可变剪接我们以前介绍过很多,一个基因的pre-mRNA经过剪接这个步骤会产生多条成熟的mRNA,而不同的mRNA功能可能类似,比如活性有高有底,也有可能完全相反。另外我们知道最近比较热的一类非编码RNA——环状RNA,也可能被剪接出来,比如正常情况下剪接出mRNA,疾病情况下剪接出circRNA。
这里我们考虑一个比较极端的例子:基因A的两条转录本A1和A2的功能是完全相反的,比如A1是癌基因,A2是抑癌基因。那么正常情况下A2起主导作用,而突变位点正好影响到了可变剪接这个过程,从而导致A2不再产生,而A1却被大量剪接出来,导致肿瘤发生。
这个例子说明的是突变位点影响到了蛋白与RNA的结合。
举了上面三个例子,我想大家应该能想到这点:当突变位点不能导致蛋白序列发生变化时,仍然可以从RNA或者DNA水平说明突变位点所造成的影响。
尽管我们只举了microRNA、转录因子和可变剪接这三个例子,大家完全可以展开考虑,比如突变位点影响到:
lncRNA-mRNA的结合,从而影响mRNA的稳定性;
lncRNA对DNA的结合,影响基因的表观调控;
lncRNA对RNA结合蛋白(RBP)的结合;
RNA的二级结构;
RNA的定位等等。
最后需要说明一点:在很多情况下,单个碱基的改变并没有什么用,对影响分子之间的结合起效甚微,所以在做机制前一定要先做功能实验证明。