数据矩阵
尽管各类检测平台的样品处理、实验方法和原始数据预处理的过程不尽相同,但是原始数据最后均会根据谱峰名称/编号和谱峰的面积生成数据矩阵,对数据矩阵进行多元统计分析后就可以获得相关信息如模型分组和差异代谢物等。
主成分分析
主成分分析(Principal Component Analysis,PCA):是一种无监督的模式识别方法,适用于没有样本所属类别信息的聚类分析。它是一种在保持数据信息损失最少的原则下,对高维变量空间进行降维处理的线性投影方法。PCA的作用在于呈现样本的真实分布以及异常点的发现。
偏最小二乘判别分析
偏最小二乘法判别分析(Partial least squares discrimination analysis,PLS-DA):是一种有监督的模式识别方法,包括“训练”和“预测”两个阶段,通常训练是预留一部分已知样本分类情况的数据建立起统计模型,用其余的样本作测试,考察模型分类正确与错误的情况。
正交偏最小二乘判别分析
正交偏最小二乘判别分析(Orthogonal Partial least squares discrimination analysis,PLS-DA):亦是一种有监督的模式识别方法,在PLS-DA验证模型正确后,OPLS-DA通过数据旋转处理,可以把组间区分浓缩在第一个主成份轴上,以便找到生物标记物/差异代谢物。
其他分析/制图项目
多组学关联分析Ingenuity Pathway Analysis、代谢物相关性分析、ROC分析、T-test、One Way-ANOVA、代谢通路图、代谢通路气泡图、火山图、热图......