聚类热图(ClusterHeatmap)是科研文章中极为常见的一种数据可视化展示手段。在基因分析中对样本和基因分别聚类后,我们可以简明直观地观察到样本和基因之间的相似情况。欧易生物云平台研发的聚类热图在线绘制工具,现在不仅只需登录网页根据要求编辑数据便可进行快速绘制,并且开创性的研发了交互式制图,可以实时对生成的热图进行修改和输出,让我们一起来看看吧!
云工具跳转链接:
https://cloud.oebiotech.com/task/detail/interactive_heatmap/(
功能介绍
欧易生物云平台提供的交互式在线聚类热图绘制系统具有五种不同的系统数据预处理模式(芯片、测序、蛋白、代谢、微生物),另外提供行列聚类,生成聚类图色系等绘制聚类热图的主要参数选择。该系统采用了大多数文章中使用的欧氏距离,平均连接的聚类算法,且数据提交后网站会自动对每个基因(行)进行Zscore的标准化,因此生成的热图具有科学性与高适用性。依托于欧易生物公司强大的云计算机配置,现在您不仅只需要30-90s便可快速完成一张美观专业的聚类热图的绘制,并且在生成的热图中还可以进行交互式的选择,即时的为您的热图进行风格上的修改和美化来使其完美符合您的要求。同时在保存热图的选项中您可以保存为png、pdf、矢量图等多种格式,满足您对于图片清晰性等方面的多种需求。
数据准备
您需要按照相应格式来处理数据整理成如下文件:
01
表达量矩阵文件
第一列为特征名称,如基因/蛋白/代谢物,其余各列为样本名称,对应值为各样品中相应表达量。请您注意:如果表达量矩阵文件中存在空值的情况,请补充完整后再分析。
图1 | 表达量矩阵文件格式示例
作图步骤
01
准备工作
请于上传文件前根据上方的“作图步骤”或云工具页面的“使用说明”的示例文件格式来进行数据文件的准备。
02
主要参数
图2 | 主要参数
03
主要参数详解
①请于主要参数中的表达量矩阵文件处上传您所要进行分析的文件,如果此处未上传文件,您将无法得出结果。上传成功后,将会于“选择文件”后显示您上传的文件名;
②数据预处理方式选择:对数据进行log化处理使颜色展示更平滑。一般情况下,芯片/微生物数据不需log处理,测序(基因/转录本)数据以2为底取对数,蛋白/代谢数据以10为底取对数。默认无需处理,请您根据上传的数据类型进行匹配选择。根据我们上传的示例数据,此处选择测序数据(如fpkm);
③对行进行聚类:是对基因/蛋白/代谢物/微生物物种聚类,展示变量间的表达模式相似度。默认为聚类,可在下拉菜单进行其他选择;
④对列进行聚类:是对样本聚类,展示不同样本/分组间的相似度,用于考察数据质量、重复性等。默认为聚类,可在下拉菜单进行其他选择;
⑤聚类图色系:我们提供了8种配色供您选择。默认为欧易配色,可在下拉菜单进行其他选择。
04
常用参数
图3 | 常用参数
05
常用参数详解
①样本名称旋转度数:默认为45,可在下拉菜单进行其他选择;
②数据归一化方式:默认为row,可在下拉菜单进行其他选择;
③聚类树划分行的簇数:基于层次聚类划分列的簇数(非负整数),如不进行列聚类或分割,则忽略参数;
④绘图数字显示:绘图数字即为归一化数值,非原始表达量。默认为隐藏,可在下拉菜单进行其他选择;
⑤图片标题:不能添加特殊字符,如 () 等。默认为Heatmap,可接受默认或自行输入。
06
最终提交
文件上传成功后请
如图所示区域:
图4 | 工具预估耗时提示处
个性化热图
(图片为使用示例文件及其他参数保持默认时的结果)
01
结果展示及下载
分析结果图将会在此处展示,
图5 | 结果展示处
02
交互式作图界面的使用
交互式作图系统分为两大模块,分别是左侧的热图预览区域与右侧的热图设置区域。当您在右侧的设置区域做出修改时,左侧的热图会即时随之改变,这可以方便您对生成热图结果的实时把控,以下截图为交互式作图的初始界面:
图6 | 交互式作图初始界面
03
交互式作图的具体设置
分布在系统右侧的交互式作图的具体设置分为五大部分:图片全局风格调整、标题设置、图例配置、X/Y轴配置、样品点调整。您可以根据需求在不同选项中选择,且热图预览区域中的聚类热图会随您的修改而实时改变,其部分设置选项如下图所示:
图7 | 交互式作图设置区域部分设置选项
04
交互式作图的操作演示
全局风格调整演示:
图8 | 全局风格调整
聚类热图整体操作演示:
图9 | 聚类热图整体演示
标题样式调整演示:
图10 | 标题设置
X轴风格修改操作演示:
图11 | X轴设置
Y轴风格修改操作演示:
图12 | y轴设置
05
交互式作图结果的生成
当您按照自己的需求完成了所有对于聚类热图的设置,且对于左侧预览区域出示的热图生成结果满意后,便可以
图13 | 交互式作图图片的保存
06
结果说明
一列表示一个样本,一行表示一种基因,其中的每个小方格都代表一个基因,其颜色代表该基因表达量的大小,
图14 | 交互式热图示例
历史记录
图15 | 历史记录示例
常见Q&A
请问需要进行数据筛选的话应该怎么修改呢?
您好,首先感谢您的咨询。建议您尽量不要在源文件进行数据筛选,新建一个全新的excel文件进行该操作会是更合适的选择。
请问绘制热图对样本数量有什么要求呢?
您好,首先感谢您的咨询。当少于2个样本时,不绘制热图;当仅有2个样本时,不对数据进行行标准化;默认条件下,行列聚类,输出聚类后排序列表;当行不聚类时,限制绘图特征数目(数据量)不能多于 65536 个;当行聚类时,特征数目(数据量)不能多于14000个。
请问如果某个特征在所有样本中数值都相等会怎么处理呢?
您好,首先感谢您的咨询。这种情况下,将会自动删除该特征并提供oeweb_task.log日志文件。
请问如果存在相同特征时会怎么处理呢?
您好,首先感谢您的咨询。这种情况下,将会自动计算表达量之和、保留高表达特征并提供oeweb_task.log日志文件。
请问存在缺失值会影响绘图吗?
您好,首先感谢您的咨询。会有影响,小工具正常运行是不允许存在空值的,所以在进行分析之前需要您对数据进行检查,补充完整数据后才能上传分析。
交互式作图可以带您更全面地了解各个层次的细节,定制您最称心的个性化图片。以上就是聚类热图交互的介绍,欧易云平台正在开发更多的交互式小工具,期待您的试用反馈。
往期推荐
探“云”指南 | 如何使用云工具进行样本相关性分析
探“云”指南 | 如何进行共表达相关性分析
探“云”指南 | 如何在线一键化进行差异分析
探“云”指南 | 微生物ROC曲线