蓝魂1205407213
我有问题想向您请教下,
1、质谱检测后的数据protein score、peptide score和eMPAI是怎么计算得来的?
2、各自又有什么含义呢?也就是说我判断鉴定到这个蛋白是否可信是以什么标准呢?如果说按照上面三个,打分越高可信度越高,但是三个之前不是同一趋向性时应该怎么判断?
3、以您的经验来看质谱鉴定的假阳性概率是多少?怎么去辨别分析假阳性结果
4、2D-gel相比现在的技术的优势在哪里?
5、MRM和PRM本质的区别在哪里?
问题有点多,这是我一直有疑问的问题,中间自己查了,但是还是觉得一知半解,希望大神帮忙解惑。谢谢!
感谢蓝魂战友的回帖。这几个问题我就综合的浅说一下个人的经验。
1、质谱检测后的数据protein score、peptide score和eMPAI是怎么计算得来的?2、各自又有什么含义呢?也就是说我判断鉴定到这个蛋白是否可信是以什么标准呢?如果说按照上面三个,打分越高可信度越高,但是三个之前不是同一趋向性时应该怎么判断?
这两个问题我一起回答一下。关于算法问题,因为我本身并不是专业的做方法和计算的,只能浅显的谈一谈。目前流行的MS软件中,纵然是各不相同,但核心原理基本一致。MS方法高度依赖数据库(目前是冗余较少的uniport比较常见,NCBI 有一定的冗余度,即是开源网站相同的蛋白氨基酸序列可能被提交了不同的ID号,目前NCBI也在致力于清除冗余,目前最简便的建议使用uniport源,http://www.uniprot.org/),打开了以后长这个样子(Unreviewed代表还没有被确定的蛋白质;同一个蛋白质可能有不同的Isoform, Natural variation,已知的PTM位点修饰等等)。
首先,需要对质谱的打分原理做一个简单了结:
1.Sample-还原烷基化-酶解(胰酶等)-肽段脱盐-HPLC分离-MS检测一级谱图(母离子)-MS检测二级谱图(碎片离子) 2.数据库选择-模拟酶切(一级谱图大小匹配)--模拟碎裂(二级碎片离子谱图匹配)-质谱预测打分评价.
peptide score的分数会根据其计算机模拟碎裂的离子大小和实际二级谱图中的匹配程度进行计算,取匹配最高(得分最高)的一个作为鉴定的结果。(m/z误差通常控制在的5-10ppm以内,ppm=百万分之一.)protein score 由peptide score和unique peptides(检索的数据库中的唯一蛋白所含的特异肽段)的数量综合得到,eMPAI的具体算法感兴趣的可以自己检索一下。判断一个蛋白结果是否可信,如果你的样品是纯化的蛋白,那么除了常规的Coverange,PSMs,peptides,还有看Unique peptides,归根到底要判断MS鉴定到的肽段离子(MS/MS谱图)的可信度。在原始谱图中有各种信息,尤其是其不同的同位素峰的丰度同样重要。如果样品是一个标准样品并且你知道它的组成,那么与期望的蛋白质序列匹配的结果可以定义为理想结果。如果是未知样品,则定义正确的结果时候要谨慎,尤其是涉及氨基酸位点修饰(翻译后修饰,PTM)的鉴定,比如STY的磷酸化等。
举个栗子~ Thermo QE Raw质谱数据中的一个某一个时间点二级碎片离子质谱图(MS/MS 原始Data).
匹配到的候选肽段(大家看到第一条匹配的数量最多,得分最高。通俗的说,软件认为第一条肽段得分远远超过了其他的候选肽段,因此可以认为这个结果是可信的。相当于一个班的同学考试,得分最高的95,其他的都是65,60,62~甚至不及格,因此可以认为95分的同学就是我们寻找的肽段):
从上图的数据大家也能看出来,3个不同的肽段大小非常非常接近,但是氨基酸的序列和肽段长短都有差别,因此软件通过各自肽段模拟的碎裂离子去匹配质谱谱图,综合得分以后给出结论。当然,如果是认为这个蛋白对你的研究非常重要,可以打开原始数据,用人工的判断该蛋白的肽段同位素峰的峰型再去确认一下,这里特别建议那些做PTM的同学使用。
3、以您的经验来看质谱鉴定的假阳性概率是多少?怎么去辨别分析假阳性结果
复杂蛋白样品,看Coverage(检测到的peptides序列在整个蛋白序列的覆盖率)和unique peptides(该蛋白特有的氨基酸序列肽段) 数量。一般来说,现在质谱的分辨率已经非常高了,碎片离子的误差都能控在5-10ppm内的结果是非常可信的了。从正面看,理论上肽段越小假阳性越高。而因为质谱的限制,太小的肽段和太大的肽段都不能被检测到可能会造成漏检。从反面看,正是因为质谱的分辨率太高,而且高度依赖搜库匹配数据,如果你的目的蛋白或者目的肽段存在任何的未知修饰或者突变,是一定会漏检的。分辨质谱的结果需要结合你的实验目的,如果是相对简单的样品(比如pull-down的),有不确定的结果就让做质谱的技术人员给你多搜几次库,多加几个可能的可变修饰。如果是复杂的样品,比如血清,组织等等就很难说了。如果你对你的样品中检测到的某一个Coverage低,unique peptide的蛋白感兴趣,最好是看看原始数据,如果有特别的例子的时候再来解释也比较好。
4、2D-gel相比现在的技术的优势在哪里?
5、MRM和PRM本质的区别在哪里?
休息一下,后面回答~其实2D胶这个问题非常好!由于MS已经开启了无标记定量技术(lable –free Quant,既在无任何处理的情况下进行两组样品中的全部蛋白质的相对含量的对比),目前关于这个吵得也比较厉害。