实用锦囊:MetaboAnalyst代谢组学分析工具实操

2020-4-20 00:58

编者按: 

代谢组学数据下机啦~

如何进行数据筛选?

如何进行数据标准化处理?

 

本篇小鹿“安利“一款实用软件:无需复杂的EXCEL操作;无需自己写代码;也无需自己写脚本;可解决代谢组学下机数据地复杂分析?

不相信

请各位“看官”继续往下看...

 

MetaboAnalyst工具软件

 

MetaboAnalyst是一个基于网络的综合性工具套件,旨在帮助用户轻松地进行代谢组学数据分析、可视化和功能注释。针对定量代谢组数据,此软件可以执行各种复杂的代谢组数据分析任务。包括数据处理、数据标准化、统计分析和高级功能的阐释。

 

本章通过手把手教您:

如何上传数据、如何处理和标准化数据、通过统计学方法鉴定显著特征...快速轻松地进行代谢组学分析。 

1587315499146759.jpg

图 | 平台分析流程

 

针对下机的代谢组学数据,首先将不同类型的数据经过不同功能的预处理,处理成标准的数据矩阵,经过数据完整性、标准型检测和转化可进行分析。

 

01:网站打开 

输入网址http://www.metaboanalyst.ca/ 

下一步:点击上面图标“按钮”进入 

1587315499948502.jpg

 网站的主要分析模块有8个模块:(在此简单列举) 

1587315499905050.jpg

1. 统计分析:提供多种统计分析工具。

2. 富集分析:模块包含大约几千组的代谢物组的文库能为人类和哺乳动物提供代谢组学的富集分析。

3.通路分析:模块能为二十几个模式物种提供通路分析,模式物种主要包括Human、Mouse、Rat、Cow、Chicken...总共有大约1600个代谢通路。

4. 功能分析:此模块的分析主要是基于前期的数据或相似性研究,计算和预估两个群体在某一置信度下,存在显著差异的样本数。

...

02:统计分析功能应用 

1587315500641087.jpg

 

 第一步:上传原始数据

选择您的数据类型和数据格式,选择上传文件,点击Submit即可。

A:首先导入网站运用.csv格式文件,同时针对导入的文件的表头需转置如下格式: 

1587315500253122.jpg

 B:根据数据表格中样本所在行或列,样本是否为成对实验,选择合适的数据类型; 

1587315501643915.jpg

 C:选择样本的导入方式后提交即可。 

1587315501897311.jpg

 

第二步数据预处理:

1. Data check

软件自动对导入的数据进行评判,评判导入的数据是否完整。

针对导入的样本、统计样本量和物质峰、分组等规范化进行评判 

1587315501794865.jpg

 

2:进行缺失值替换

选择适合自己的缺失值的方式:其中包含缺失值>50%删除;缺失值替换:最小值的一半;缺失值直接删除等,也可选择均值、中位数、kNN、随机森林的方法替换。(见下图) 

1587315501130540.jpg

 

1587315509805041.jpg

 

点击“SKIP”后,进入下一步。

 

3.Data Filtering

在代谢组学的数据中,特别是靶向代谢组学中,含有大量的变量,其中有一些的变量是由于基线噪音引起的,在数据建模和分析中不可用。一般来说,具有以下特征:

(1)极小值(临近基线或检出限的数值);

(2)恒定不变的值(不随实验条件变化的值);

(3)重复性不好的变量。

可以通过数据过滤来去掉,可以选择不同的函数对异常变量进行过滤。 

1587315509620289.png

 选择过滤函数后,点击submit和proceed,进入数据标准化的流程。

 

4.数据标准化

数据标准化分为三类:A:sample normalization B:data transformation c:data scaling

通过样本归一化能突显出样本的特征性。运用数据转化和数据归一化,主要将数据限定在一定的范围内,使得后续分析更加方便。

提醒:在数据规范化中这一步不是必须要做的,要具体问题具体分析。 

1587315509630017.jpg

 

5.获得结果处理方式:(见下图) 

1587315509429497.jpg

 

1587315509752125.png

  

03:软件的优势:快捷可实现手动的表格操作不了的算法; 

04:主要特点: 

•同步发布R软件包(MetaboAnalystR)以及相应的R 命令的历史面板以实现更透明及可重复的分析;

•扩大了代谢组和代谢通路数据库,从而通过功能富集分析实现代谢组学的数据解释;

•增加了基于MUMICHOHG算法、利用非靶向代谢组学数据实现通路活性预测新模块;

•可支持代谢组学生物标志物meta分析的新模块;

•可支持通过基于知识的网络分析和可视化实现多组学数据整合的新模块

 

 

END


领域:蛋白/抗体/蛋白质组,多组学/蛋白质组/代谢组/脂质组