分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

探“云”指南 | 免费物种功能贡献度分析小工具不容错过!

创新多组学技术服务
2023.3.22
4124b83e04d075285c3d40a5a8f42b5d.gif


还在发愁物种功能贡献度的结果如何绘制成精美图表吗?云平台本期推出的物种功能贡献度分析小工具您千万不能错过,不仅免费高效,还简单省力,话不多说,现在我们就来看看这款小工具如何快速上手。

c555fc0319aa6a82452501c2b6ca2a5d.png


功能介绍



基于样本中物种与功能的对应关系,进行物种丰度与功能丰度之间的关联分析,旨在找出特定功能的物种贡献度或者特定物种的功能贡献度,可以研究Top功能或代谢途径主要存在于哪些物种,也可以研究Top物种所具有的主要功能或代谢途径。


文件要求



01

样本物种丰度文件

Cluster_id列:进行物种丰度测序的群落名称

taxonomy列:物种各层级(界、门、纲、目、科、属、种)水平上的分类信息,用分号分隔

样本丰度信息:项目测得各组群落在各样本中的丰度值


006a926dcac06fac1088a8c7869cf0a2.png

图1 | 样本物种丰度文件格式示例


02

数据库注释文件

示例为OE常规转录组分析中差异表达结果,列信息需包含 "Cluster_id"和至少一种对应的注释功能表头


2.2.1 CAZY数据库注释文件

CAZY数据库对应的功能表头为" Family、Class、 Class_Definition",如图所示:

请您注意:若输入的注释数据表头同时存在Class和Class_Definition表头,将只对Class功能进行分析


1242b608c4963c9ffb9f0f25dbfcb950.png

图2 | CAZY数据库注释文件格式示例


2.2.2 CAZY | family数据库注释文件

CAZY | family数据库对应的功能表头为“Family、Class”,如图所示:


946c2e2df2ca62b6ab5fe63158102ad9.png

图3 | CAZY.family数据库注释文件格式示例


2.2.3 CARD数据库注释文件

CARD数据库对应的功能表头为“ARO_Name、Drug_Class、 Resistance_Mechanism”,如图所示:

请您注意:Drug_ClassResistance_Mechanism功能用分号分隔。


d8a9fd57dad0169aa87b15aaede92d93.png

图4 | CARD数据库注释文件格式示例


2.2.4 GO数据库注释文件

GO数据库对应的功能表头为"GO_Anno",如图所示:

请您注意:同一个群落样本注释到多条GO通路的用竖线分隔,分别对level2水平("molecular_function"、"cellular_component"、"biological_process")及括号内的GO ID进行绘图。


e8c065e8855b04aeda8bf6e3b63c3c90.png

图5 | GO数据库注释文件格式示例


2.2.5 eggNOG数据库注释文件

eggNOG数据库对应的功能表头为“Abbreviation”,如图所示:

请您注意:Abbreviation功能以单个字符进行分隔


7daf6772dfc2527ee3d9ff1fc7a13d37.png

图6 | eggNOG数据库注释文件格式示例


2.2.6 KEGG数据库注释文件

KEGG数据库对应的功能表头为“KO、Pathway、 Moudle、 EC_number”,如图所示:

请您注意:Pathway功能用逗号分隔, Moudle功能用竖线分隔


60b3f724d9efb86198632b8663c884e4.png

图7 | KEGG数据库注释文件格式示例


2.2.7 VFDB数据库注释文件

VFDB数据库对应的功能表头为”VF_Name、 VFDB_VF_ID、 VF_species”,如图所示:

请您注意:VFDB_VF_ID功能将会对应VFDB数据库的VF_Name进行绘图


e2bf58fb8607889eb913d77dd6b2fc93.png

图8 | VFDB数据库注释文件格式示例


2.2.8 PHI数据库注释文件

PHI数据库对应的功能表头为Protein_ID、Gene_name、 Pathogen_species、Disease_name、 Host_descripton、 Function、Phenotype_of_mutant”,如图所示:

请您注意:若输入的注释数据表头同时存在Gene_name Protein_ID表头,将只对Gene_name功能进行分析;若输入的注释数据表头同时存在Disease_name Pathogen_species表头,将只对Disease_name功能进行分析。


2c9b1a438289afda8ec73b6b98c36a76.png

图9 | PHI数据库注释文件格式示例


参数调整



01

主要参数


9f69578d5862adc2399ec62d3aa33c43.png

图10 | 主要参数


02

常用参数


1f6aa3f1f620f4396fda4d69e709f402.png

图11 | 常用参数


作图步骤



01

主要参数调整


4.1 主要参数调整(此处以CAZY数据库注释文件为例)

①请于主要参数中的样本物种丰度文件数据库注释文件处上传您所要进行分析的文件,如果此处未上传文件,您将无法得出结果。上传成功后,将会于“选择文件”后显示您上传的文件名;

此处为上传成功示例:


44543aea29b00d9524695862984e3b9d.png

图12 | 文件上传成功示例


②物种水平:选择绘图的物种分类水平。默认为“”,可在下拉菜单进行其他选择;

③数据库类型:进行功能注释的数据库。默认为“CAZy”,可在下拉菜单进行其他选择。

请您注意:数据库类型与相应数据库注释文件功能的对应关系见上述2、文件要求——2 | 2、数据库注释文件。

④任务命名:对结果进行命名用于区分不同的任务,默认为当前工具名称_结果创建日期时间,在历史记录的注释处可见,可接受默认或自行输入。


02

常用参数调整


①物种类别数目:默认为“10”,选取对应物种分类水平上各类别贡献度排名前10的类别,其余合并为“others”进行绘图。可接受默认或自行输入;

②功能数目:默认为“10”,注释的功能数大于10时,选取前累积贡献度排名前10的功能,进行绘图。可接受默认或自行输入;

③输出图片格式:默认为“pdf”,可在下拉菜单进行其他选择;

④配色方案:物种功能贡献度条形图的配色方案,平台提供了24种配色方案供您选择。默认为“默认配色”,可在下拉菜单进行其他选择;


03

最终提交

文件上传成功后点击“提交”,右侧工作区将提示您所需时间。

如图所示区域:


b24ea2b4ecc2f682cc04ebe70b8131ab.png

图13 | 工具预估耗时提示处


结果分析


(以下图片为使用示例文件以及参数均选择默认的结果)


01

结果展示及下载


分析结果未在工具区直接展示,您可以点击左上角的“结果下载”将结果保存至本地。


0fbf90aacbe0fb3dcdaf71f1b1478045.png

图14 | 结果展示处


结果下载成功示例:点击“结果下载”您将会得到如下压缩包,您所得压缩包名称与下面示例名称不同为正常现象。


db5fc8d77ab648a4baabc080d098b531.png

图15 | 结果下载成功示例


结果文件内容示例:


db333b9d253cf8d542cd8d5c8f7874d8.png

图16 | 结果内容示例


02

结果说明


5.2.1、物种功能贡献度circos图

下图即为OE常规微生物分析中的物种功能贡献度circos图,注释数据库为CAZy,注释功能只有Class


①最外层是物种或功能的名称:

Other,g_Prevotella,g_Alistipes,g_Bacteroides,g_Parabacteroides,g_Clostridium,g_Phocaeicola,g_Methanobrevibacter,g_Treponema,g_Lactobacillus,g_Oscillibacter为物种名称;

GH,GT,CE,CBM,PL,AA为功能名称;

次外层为百分数,表示贡献度的组成百分比;百分数刻度内测的贡献度数值范围,表示具体贡献度数值;

贡献度数值范围刻度下的颜色各自对应最外层的物种或功能;

最内侧的弧形颜色条带长度表示不同物种或者功能贡献度的组成占比;

内圈粗细连线表示从物种出发,向各个功能分散,或从各个功能出发,向各个物种分散。表示各功能对物种的贡献度,或者是各物种对功能的贡献度。


54096a2b2ffe2f24178e1e8cdb644429.png

图17 | circos图示例


5.2.2 条形图——功能对物种的贡献度

下图展示了所有物种中功能贡献度的情况,横坐标为样本名称,纵坐标为贡献度数值,条形图中条形的不同颜色代表不同的功能,具体对应关系见右侧图例,功能按其对所选各物种的贡献度之和从大到小排序,即条形图从上至下看。


e56ab2cff868b31320ae35633c21e6fd.png

图18 | 功能对物种贡献度的条形图


5.2.3 条形图——物种对功能的贡献度

下图展示了所有功能中物种贡献度的情况,横坐标为样本名称,纵坐标为贡献度数值,条形图中条形的不同颜色代表不同的物种,具体对应关系见右侧图例,物种按其对所选各功能的贡献度之和从大到小排序,即条形图从上至下看。


245742dbf89cf256448e8294a98d67f6.png

图19 | 物种对功能贡献度的条形图


历史记录



点击欧易集团云平台界面右上角的“登录”,您可以进行免费注册,用您注册的账号登录欧易云平台个人中心,在此之后使用云平台所有的小工具将会存有记录。您可以点击下图中的“历史记录”查看使用物种功能贡献度分析小工具的使用记录,或点击右上角“个人中心”查看所有小工具任务记录。


5d8ae59c131c3a66b1b80cbf4b70ae10.png

图20 | 历史记录示例



常见Q&A


0adab4b44fcf44fc418b7bbcb3d7656e.jpeg

请问对于样本物种丰度文件的格式是如何要求的?

您好,首先感谢您的咨询。样本物种丰度文件列需包含且仅包含 “Cluster_id、taxonomy、样本”三列信息,并且样本列的样本丰度信息必须为数值型数据。

5461d574002a42b7aebb9fe486c3841b.png
0adab4b44fcf44fc418b7bbcb3d7656e.jpeg

请问不同数据库注释文件包含的功能表头是一样的吗?

您好,首先感谢您的咨询。不同的数据库对应不同的注释文件,不能混为一谈。本小工具包含的数据库类型较多,数据库注释文件具体需含有哪些特定的功能表头,请您参考上述2、文件要求——2.2、数据库注释文件中的文件示例与详细说明。

5461d574002a42b7aebb9fe486c3841b.png
0adab4b44fcf44fc418b7bbcb3d7656e.jpeg

请问除了上述示例用途,该小工具还有什么功能呢?

您好,首先感谢您的咨询。不同的数据库对应不同的注释文件,不能混为一谈。本小工具包含的数据库类型较多,数据库注释文件具体需含有哪些特定的功能表头,请您参考上述2、文件要求——2.2、数据库注释文件中的文件示例与详细说明。

5461d574002a42b7aebb9fe486c3841b.png

使用上面介绍的物种功能贡献度分析小工具,无需自己编程,所有难题我们已经帮您搞定,只需按照步骤点击鼠标,就能得到心仪的结果图,感兴趣的话快来云平台体验吧~


猜你想看

1、探“云”指南 | 拜托!谁不喜欢清晰直观的条形图啊!!!

2、探“云”指南 | 全体复诵:欧易云GSEA分析!

3、探“云”指南 | 微生物和代谢物相关性分析怎么做?

4、探“云”指南 | 欧易云小提琴图交互速速mark!

fd8f12761327790fb918c8d3df8b5041.png

END

排版人:小久


原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。

903a9138df065e165c7e51c77b6ca740.gif
cf2d563f070227bd868197cb08e23b88.gif

点击“阅读全文” 收获更多精彩

发布需求
作者
头像
仪器推荐
文章推荐