土壤非靶标代谢组学(Untargeted metabolomics)检测分析方案
一、项目简介
1.1 土壤代谢组学概述
土壤代谢组学(soilomics)是指用代谢组学的方法研究土壤中有机质及土壤微生物代谢含量变化及相互作用的一门科学。土壤微生物是土壤不可缺少的组成部分,是陆地生态系统中的分解者和调节者,能够参与生态系统的物质循环以及能量流动,其分布及活性揭示土壤的变化规律和演变趋势。研究土壤微生物碳代谢功能特征可以了解微生物多样性及其碳代谢能力,为探索调节、控制和改善土壤环境质量提供重要的参考。
表1. 土壤碳源主要化合物
1.2 技术路线
图1. 土壤代谢组学技术路线图
1.3实验设计土壤样品,分A, B, C, D四组,每组6个平行样品,共计24例,进行GC-TOF-MS平台的土壤非靶标代谢组学检测,并对得到的数据进行进一步生物信息学分析。样品详情:共计24例样品。1.4分析内容针对非靶标代谢组学数据分别进行如下对比,并对得到数据进行进一步的生物信息学分析:进行A组 vs D组,B组 vs D组,C组 vs D组共计3次对比分析。基础数据分析包括:数据预处理,主成分分析(PCA),正交矫正偏最小二乘法判别分析(OPLS-DA),差异化合物筛选。1.5检测平台检测分析平台:GC-TOF-MS二、检测分析方案2.1数据预处理对原始数据进行解卷积,峰对齐,标准化分析,通过原始总离子流(TIC)色谱图,初步观察仪器的保留时间重现性,所测得的物质数量,以及不同组之间的色谱图是否具有较明显的差异。
图2. 所有GC-TOF-MS样本重叠总离子流(TIC)色谱图
2.2 PCA分析对样本进行主成分分析能从总体上反应各组样本之间的总体代谢差异和组内样本之间的变异度大小。使用SIMCA软件(V14.1, Umetrics, Umea, Sweden)对数据进行UV格式化(Unit Variance Scaling)和平均中心化(Mean-Centered)处理[1],以获得更加可靠且更加直观的结果。软件进行自动化模型拟合分析,获得最可靠数学模型的主成分数目。例图如下所示:
图3. PCA模式识别得分图
[1] Scaling base weight types available:
2.3正交偏最小二乘方-判别分析(OPLS-DA)为了消除与分类不相关的噪音信息,同时也为了获得导致两组之间显著差异的相关代谢物信息,我们采用正交偏最小二乘方判别分析(OPLS-DA)过滤与模型分类不相关信号即正交信号,获得OPLS-DA模型。对模型的质量用交叉验证法进行检验,并用交叉验证后得到的R2X 和Q2(分别代表模型可解释的变量和模型的可预测度)对模型有效性进行评判。在此之后,通过排列实验对模型有效性做进一步的检验。例图如下所示: [2] 载荷图(loading plot)的横坐标代表每个物质在第一主成分上的载荷大小(cosα),纵坐标代表每个物质在第二主成分上的载荷大小(cosβ)。[3] 置换检验的横坐标代表随机分组的Y与原始分组Y的相关性,纵坐标代表R2和Q2的得分。[4] ROC作为模型的一种外部检验,当AUC越靠近1时表示模型越可靠。[5] S-plot的横坐标代表每个物质在第一主成分上的载荷大小(cosα),纵坐标代表每个物质和第一主成分相关系数(可靠性)的大小。[6] S-line的横坐标代表每个物质的ID,纵坐标代表每个物质在第一主成分上的载荷大小(cosα),颜色代表纵坐标代表每个物质和第一主成分相关系数(可靠性)的大小。2.4代谢物定性及差异化合物筛选代谢物定性的方法为:搜索Biotreelib GC-MS标准物质数据库和NIST商业数据库(自动峰识别和保真解卷积®)。我们采用 OPLS-DA模型第一主成分的VIP(Variable Importance in the Projection)值(阈值>1),并结合学生氏t检验(t-test)的p值(阈值≤0.05)来寻找差异性表达代谢物。三、时间概算实验检测:45个工作日(从收到客户预付款并收到样品之日起)数据分析:10个工作日