■ ■■■■
视频解说教程
在组学研究文章中,为了展示变量(代谢物、蛋白质、基因)之间的相关性,经常会看到相关性聚类热图。相关性聚类热图顾名思义就是根据数据之间的相关性系数来绘制的热图,可通过热图中颜色变化反馈变量之间相关性大小。
相关性聚类热图可应用于代谢组、蛋白组、基因组数据,可分为组内相关性聚类热图和组间相关性聚类热图。组内相关性聚类热图,由一组数据内部的相关性系数绘制而成,即对单一组学数据进行分析。组间相关性聚类热图指利用两组数据间的相关系数值绘制而成,即对多个组学数据进行分析。
■ ■■■■
图1.代谢物相关性聚类热图
■ ■■■■
图2.基因与代谢物相关性聚类热图
单一组学以代谢物相关性聚类热图为例。在热图中每一行和每一列都代表一个代谢物。热图中的每个单元格的颜色展示的是对应列代谢物和对应行代谢物的相关系情况。颜色根据相关性系数制定:红色代表正相关,绿色代表负相关,颜色越红或越绿代表相关性越强。
■ ■■■■
图3.代谢物相关性聚类热图示例
多组学以代谢物与蛋白质相关性聚类热图为例。在热图中每一行代表一个蛋白质,每一列代表一个代谢物。热图中的每个单元格的颜色展示的是对应列代谢物和对应行蛋白质的相关性情况。颜色根据相关性系数制定:红色代表正相关,绿色代表负相关,颜色越红或越绿代表相关性越强。图例中ClassⅠ代表代谢物一级分类。
■ ■■■■
图4.蛋白与代谢物相关性聚类热图示例
在热图中可以对列数据和行数据进行聚类,聚到一起的表明蛋白质或代谢物相关性特征比较一致。
a. 单一组学相关性聚类热图
由于转录组和蛋白组数据量庞大,因此单一组学聚类热图通常在代谢组学中应用较多。
不同代谢物之间具有协同或互斥关系,相关性聚类热图可以帮助衡量显著性差异代谢物之间的代谢密切程度,有利于进一步了解生物状态变化过程中代谢物之间的相互调节关系。
b. 多组学相关性热图
可通过相关性聚类热图将多组学数据关联,进行数据挖掘,以了解从基因到蛋白再到代谢的调控过程,寻找调控关键代谢途径的基因和蛋白。
■ ■■■■
图5.基因与代谢物相关性热图应用案例
相关性聚类热图是根据变量相关性系数绘制的热图,那相关性系数如何来的?首先就需要了解什么是相关性分析。在数据处理的过程中,我们一般将描述和分析变量相关关系的性质及其相关程度的过程,称为相关分析,常用的相关性分析方法有Spearman相关系数和Pearson相关系数。相关系数r反应两个变量相关性的强弱,|r|的值越接近与1,则变量之间的相关性程度就越高;越接近于0,则变量之间的相关性程度就越低。
往期精彩:
●视频实操SCI作图课(5):如何合并代谢物数据?合并表格2min搞定!
●视频实操SCI作图课(4):高级火山图实操,让你的文章火起来!
●视频实操SCI作图课(3):OPLS-DA分析,组间差异的挖掘神器
●视频实操SCI作图课(2):怎么筛选差异代谢物?PLS-DA来搞定
●视频实操SCI作图课(1):3min做出让审稿人满意的高级PCA图
客服微信:metware888
咨询电话:027-62433042
邮箱:support@metware.cn
网址:www.metware.cn
我就知道你“在看”