分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

探“云”指南 | 一文教你WGCNA分析

创新多组学技术服务
2023.6.14

加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集,并根据基因集的内连性和基因集与表型之间的关联鉴定候补生物标记基因或治疗靶点。

功能介绍

基因共表达网络(WGCNA, Weighted Gene Co-Expression Network Analysis),是一种从高通量的表达数据中挖掘模块(module)信息的算法,在该方法中module被定义为一组具有类似表达谱的基因,并探索module内基因网络与研究者关注的表型之间的关联关系。

文件要求

01

表达矩阵文件

FPKM表达矩阵文件,第一列为基因名称,其余列名为样本名称,对应值为表达量或信号值。

图1 | 表达矩阵文件格式示例

02

表型文件

第一列为样本名称,其余列为表型名称,对应值为每个 表型的数字型特征值。

请您注意:不会对非数值型的表型进行分析。

图2 | 表型文件

参数调整

01

主要参数

图3 | 主要参数

02

常用参数

图4 | 常用参数

作图步骤

01

准备工作

请于上传文件前首先查看“使用说明”中的示例文件格式,根据提示进行文件准备。

02

主要参数设置

①请于主要参数中的表达矩阵文件、表型文件处上传您所要进行分析的文件,为必填参数。在“选择文件”后显示上传的文件名说明上传成功。

此处为上传成功示例:

图5 | 文件上传成功示例

②任务命名:对结果进行命名用于区分不同的任务,默认为当前工具名称_结果创建日期时间,在历史记录的注释处可见,可接受默认或自行输入。

03

常用参数设置

①权重参数:默认为自适应。具体值可在结果报告中找到。您也可以自行指定权重值,这种情况一般用于已知power或者有指定power时再次进行分析。

②标准差阈值:对数据进行标准差过滤,剔除标准差小于该阈值的基因。可选择范围为0-1,数值越大保留的基因越少。默认为“0.5”。

③模块合并阈值:模块合并的参数阈值。可选择范围为0-1,数值越小模块越多。默认为“0.25”。

④模块网络图hub节点数量:模块网络图中展示的top节点数量选择,默认为“50”。

⑤是否展示hub节点对应的所有边:选择模块网络图中是否需要展示hub节点对应的所有边,默认为“否”,仅展示top200的边。

⑥是否保存所有节点的连接度数据:选择是否增加输出“module_all_gene.csv”与“module_all_cytoscape.txt”文件,保存所有节点的连接度数据与cytoscape文件,默认为“否”,即不输出。

04

最终提交

文件上传成功后

如图所示区域:

图6 | 工具预估耗时提示处

结果分析

(图片为使用示例文件及其他参数保持默认时的结果)

01

结果展示及下载

分析结果保存6个月,请注意及时下载保存,

图7 | 结果文件夹内容

02

结果说明

5.2.1、网络构建参数选择——网络拟合计算与选定的网络构建参数的拟合曲线

确定最优软阈值参考左图,在不同软阈值,即x轴下的无标度拟合指数,即y轴。

(R包WGCNA的pickSoftThreshold规则为选取第一个达到R平方大于0.85的power值; 若未达到0.85, 则取第一个达到较为稳定的R平方值power; 若均未满足,取最大power值)

右图为不同软阈值情况下的网络连通度。

右图可以看出节点的连通性,即ck,跟频率的概率,即p(k)成负相关,说明选择的最优软阈值能够建立基因无尺度网络。

图8 | 网络拟合计算与选定的网络构建参数的拟合曲线示例

5.2.2、 模块识别与分析结果

左图是基于最优软阈值构建共表达网络,上半部分是基因的层次聚类树状图,下半部分是基因模块,也就是网络模块。上下对应,可以看到在距离矩阵中距离较近的基因被划分到了同一模块。

右图是基因之间的相关性热图。其中颜色越深说明基因之间的相互作用越强。对角线表示模块内部基因之间的相互作用,所以颜色最深。左侧和上面都有模块间的聚类树。

图9 | 加权共表达网络构建结果示例

这是模块内基因表达信息统计

图10 | 模块内基因表达信息统计示例

5.2.3、模块性状关联分析结果——散点图与热图

散点图可以查看基因与模块的相关性(Module Membership,MM)和基因与性状的相关性(Gene Significance,GS)之间是否有某种关联,此处MM与GS呈现负相关。

热图展示了Pearson计算模块(eigengene)与trait的相关性。

图11 | 模块性状关联分析散点图与热图结果示例

5.2.4、核心基因分析结果——模块内核心基因网络图

模块内核心基因网络图可视化展示模块内连接度最高的一群基因间的互作关系,此图展示的节点数量为top50。

图12 | 模块内核心基因网络图结果示例

历史记录

图13 | 历史记录示例

常见Q&A

请问对上传的两个文件格式有什么要求?

您好,首先感谢您的咨询。对于表达矩阵文件,第一列为基因名称,其余列名为样本名称,对应值为表达量或信号值;对于表型文件,第一列为样本名称,其余列为表型名称,对应值为数值型特征值,这里您要注意该文件要求不能含有非数值型的值,否则运行报错。

猜你想看

1、探“云”指南 | 微生物ROC曲线

2、探“云”指南 | 免费物种功能贡献度分析小工具不容错过!

3、探“云”指南 | 拜托!谁不喜欢清晰直观的条形图啊!!!

4、探“云”指南 | 全体复诵:欧易云GSEA分析!

发布需求
作者
头像
仪器推荐
文章推荐