分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

SIMCA OPLS回归分析:一种挖掘表型与组学数据关联的高级分析工具

中科新生命蛋白代谢多组学
2018.11.29

了解代谢组学的老师想必一定听说过SIMCA软件。在做代谢组学数据分析的时候,通常我们会用SIMCA软件去做PCA和OPLS-DA分析。SIMCA是一款功能非常强大的软件,除了可以做常规的组学分析内容之外,还可以做很多其他的分析内容,比如说相关性分析、ROC分析、回归分析等等。今天小编要跟各位老师介绍的是SIMCA的OPLS回归分析。

1.什么是OPLS回归分析?

回归分析是一种预测性的建模技术,它研究的是Y变量(目标参数)和X变量(自变量)之间的关系。OPLS回归分析可以用于研究Y变量和多元X变量之间的关系。通过SIMCA的OPLS模块,建立组学多元变量数据与功能、质量、等级等宏观数据,或时间、浓度等实验条件之间的关联,从而实现筛选重要变量、建立评价标准和考察工艺过程等目的。

2.应用场景

(1)常规数据分析—浓度、时间与代谢物数据之间的关联

对于多个浓度处理或多个时间点的这种实验设计,研究者最关注的是随时间、浓度梯度变化的代谢物。大家熟知的OPLS-DA适用于两两之间的分析,在这种情况下也只能是英勇无用武之地。可能这个时候,研究者不得不需求其他的解决方案,比如说做ANOVA分析或趋势聚类分析等等。然而这些分析方法都是对代谢物进行逐一考察,缺乏整体层面上对代谢物权重(反映的是代谢物的重要性程度)的考量,因此不能进一步告诉研究者这些随时间或浓度变化的代谢物中哪种代谢物更为关键。不得不说,这个时候OPLS回归分析的优势就体现出来了,不仅适用于多个浓度处理或多个时间点的这类需求场景,同时给出了代谢物的权重信息,因此可以筛选出随时间或浓度变化的且最为重要的代谢物。

(2)深度数据挖掘

▶ 临床生物标志物的筛选─临床参数与代谢组学数据关联

临床参数作为Y,建立与代谢组学数据的OPLS回归模型,可以应用于生物标志物的筛选。例如2016年发表在J Dent Res.(2016 Nov;95(12):1381-1386)上的一篇文章,通过OPLS回归模型筛选到了与临床参数PISA(牙周炎性组织表面积,反映牙周炎严重程度的一个参数)显著性相关的8种代谢物,进一步通过ROC分析,结果显示5-氧代脯氨酸,组氨酸和尸胺的组合具有最优的诊断能力(AUC=0.881)。

▶ 药物活性物质筛选─药物评价参数与代谢组学数据关联

药效评价参数作为Y,建立与代谢组学数据的OPLS回归模型,可以应用于药物活性物质的筛选。例如2016年发表在Metabolomics(2016;12:90. doi: 10.1007/s11306-016-1025-6.)上的一篇文章,通过OPLS回归模型的S-plot图筛选到了多种与抗菌活性相关的多种代谢物。

▶ 品质得分预测─感官品评值与代谢组学数据关联

感官品评值作为Y,建立与代谢组学数据的OPLS回归模型,可用于预测新样本的品质得分。例如2017年发表在food chemistry(2017 Apr 15;221:311-316)上的一篇文章,将40种绿茶作为训练集,建立茶叶感官品评值与代谢组学数据之间的OPLS回归模型,随后又将10种绿茶作为测试集,发现通过OPLS回归模型能够准确预测真实得分(误差在±1.36%)

▶ 发酵过程的优化─产量或工艺参数与代谢组学数据关联

发酵产量或其他工艺参数作为Y,建立与代谢组学数据的OPLS回归模型,可用于发酵过程的优化。例如2017年发表在J Biosci Bioeng(2017 Nov;124(5):498-505)上的一篇文章,通过建立大肠杆菌胞内代谢组学数据与丁醇产量之间的OPLS回归模型,发现acetyl-CoA和蛋氨酸与丁醇产量相关。后续基于这两种代谢物对菌株进行了优化和改良,最终提高了丁醇的产量。

3. OPLS回归分析主要事项

对于OPLS回归分析,最重要的是Y变量的确立。Y变量一定要是一个具体的连续的数值才能进行OPLS回归分析哦~

中科新生命除了能够提供常规的PCA,OPLS-DA等分析内容外,还能够提供OPLS回归分析、WGCNA分析服务,有需要的老师请和我们联系~

WGCNA往期回顾:

给大家介绍一下,这是刷爆高分文章的共表达网络分析@WGCNA分析

魅力无极限——解决组学数据挖掘的高级生信分析WGCNA

重磅!高级生信分析WGCNA揭示多发性硬化症的代谢变化特征

发布需求
作者
头像
仪器推荐
文章推荐