WGCNA大家一定都不陌生,是一种从高通量表达数据中挖掘模块(module)信息的算法,在该方法中module被定义为一组具有类似表达谱的基因,并探索module内基因网络与研究者关注的表型之间的关联关系。
但WGCNA对于稀疏矩阵的(稀疏矩阵即Sparse Matrix,是指其元素大部分为零的矩阵)敏感性性能相对较差,单细胞数据或者空间组学数据中固有的稀疏性和噪声会导致虚假的基因-基因相关性。
今天给大家介绍一款基于WGCNA开发的hdWGCNA R包[1],适用于在单细胞RNA-seq、空间转录组学、空间代谢组学等高维组学。
由于单细胞或空间组学数据的相关结构对于不同的子集(细胞类型、细胞状态、解剖区域)有很大差异,所以hdWGCNA流程考虑了这些因素,将高度相似的细胞整合成 "metacells元细胞"或者"metapixels元像素点",以减少稀疏性,同时保留细胞的异质性。
接下来将从workflow和结果展示2部分内容来给大家做简单介绍:
HdWGCNA的workflow如下图所示:
在将数据导入到hdWGCNA分析前,一般会对数据做一定处理。可以使用Seurat、Scanpy等R包进行处理。
质控,比如单细胞转录组数据中,对于线粒体占比高、doublet等细胞的处理;
数据标准化,在对数据过滤后,一般会进行Normalization操作,如Seurat默认使用通用的“LogNormalize()”方法;
其它如workflow中提到的“Feature selection”、“Dimensionality redution”、“Batch correction”、“Clustering and annotation”都可以针对具体的项目需求,选择性进行处理。
这一步也是hdWGCNA中最核心的一步。Metacells定义为:代表不同细胞状态,但feature特征相似的细胞。在空间代谢组中,metapixels的定义类似。
基于KNN bagging方法,将相似的cell进行merge。或者将邻近ST spots进行merge。减少了数据的稀疏性,因此也增加了每个“data point”的信息。这样降低了metacells表达谱的噪音。
基于metacells/metaspots/metapixels的定义,得到cell/spot/pixel population矩阵。同时可以过滤掉一些在cells/spots/pixels中一些方差为零的feature,构建矩阵用于下游的Network的构建。
同WGCNA一样,需要进行软阈值的筛选,软阈值用于减少计算基因-基因相关性的噪音。
在确定软阈值后,进一步进行网络构建、模块相关性分析、TOM矩阵等分析。
在相关性网络中,一般会重点关注“hub gene“,即和模块高度关联的基因(module Eigengene)。kME(eigengene connectivity)为特征基因连接度,用于筛选“hub gene”。
由于hdWGCNA适用于单细胞以及空间组学(空间转录组、空间代谢组等)数据,鹿明已经将流程用于空间代谢组分析中。通过实际的案例,咱们来一起看看hdWGCNA的呈现结果吧!
案例共14例样本,4例正常样本(Normal*4),5例纤维化样本(Fibrosis*5),5例肿瘤样本(CA*5),通过空间代谢组样本对应的HE染色以及空间成像图,从各样本中进行数据选区,并根据挑选的区域特征将所有样本区域分为4个不同的Level层级(Group)1~4。
目标:找到从Level1到Level4中代谢物响应值逐渐增多的代谢物modules。
基于raw data在Group以及Sample维度的UMAP降维聚类图。如下:
在对数据进行metapixel处理后,再次进行UMAP降维聚类分析,如下:
计算得到最佳软阈值为30,并绘图展示:
在挑选最佳软阈值后,进行Network构建,并进行Dendrogram以及TOM(即相关性矩阵)的可视化展示分析:
从上图可以看出共构建出8个module,并基于8个module展示了module间的聚类关系和相关性。
在hdWGCNA中, 重点关注”Hub-Feature”, Hub-Feature即和模块有高关联度的这些特征。
4.1 模块kMEs可视化展示
kME (eigengene connectivity) 为特征基因连接度,用于筛选Hubgene。对各模块Hub-Feature的kMEs进行可视化展示如下:
对top25的Hub-Feature的hMEs进行uMAP/t-SNE可视化展示如下:
结合1中原始umap图,可以直观看到各module的Hub-Feature的分布。
4.2 模块相关性展示
同时基于hMEs对各模块进行相关性分析, 绘图如下:
上图展示module之间的相关性,玫红色代表正相关,蓝色代表负相关,颜色越深相关性系数值越大。
4.3 模块内Feature特征展示
针对划分的所有模块,进行整体模块内特征代谢物表达趋势绘制:
上图从左至右,依次为模块内特征代谢物丰度拟合图(loess拟合)、丰度折线图以及小提琴图。可以看到各module内代谢物强度在从Level1至Level4表现出不同的变化趋势。
4.4 模块内Feature特征展示
绘制模块Feature在不同分组/性状的表达特征点图, 如下:
如上例图展示,Level1,Level2,Level3,Level4为4个不同的选区Group分组,对应病理不同严重程度,Level4为肿瘤组织。可以看到,Malignancy-M1、-M2、-M5、-M6的Features强度在Level4中最高, 是潜在的可以重点关注的module。
4.5 模块Network
对所有模块的Network进行可视化展示, 同时绘制各模块内Feature的Network。以module1(Malignaccy-M1)为例展示:
针对hdWGCNA分类的模块, 进行模块内不同表型或者分组为依据的差异分析。如分别分析Level1/Level2/Level3/Level4 和剩余3类分组在8个module的差异。
同时绘制差异的火山图和棒棒糖图如下:
计算模块和各性状的相关性, 如下:
同时对模块内的Hub代谢物进行KEGG富集分析如下:
进一步可以将hdWGCNA分析得到的各module代谢物响应强度,在空间上进行可视化展示:
[1] Morabito, Samuel, et al. "hdWGCNA identifies co-expression networks in high-dimensional transcriptomics data." Cell Reports Methods (2023).
对空间代谢组以及hdWGCNA感兴趣的各位老师,欢迎联系鹿明售后工程师哟~~,或者小鹿电话:17317724501
小鹿推荐
关注
鹿明生物提供优质的空间代谢组服务
空代仪器平台
已搭建2套AFADESI-MSI质谱成像系统+1套Waters DESI-MSI质谱成像系统
项目执行
已落地执行项目百余项、检测组织样本类型20+;
技术标准立项
鹿明空间代谢组荣获上海市2023年度“科技创新行动计划”空间代谢组学分析检测的技术标准专项立项
定性算法经过多维校准
定性结果同时考虑物质表达空间情况、加和离子及同位素峰表达强度相似性、同位素表达空间分布相似性、非靶向质谱数据和空代自建数据库进行校准。
项目实测结果
可实现定性代谢物数量:1000-3000个代谢物
无偏好性检测代谢物::70%为700Da以下的小分子物质,30%为脂质类物质,更加适合代谢组学研究方向;
.
文末看点|lumingbio
上海鹿明生物科技有限公司是欧易生物旗下从事蛋白质组及代谢组质谱检测的专业质谱组学服务公司。公司建有空间代谢组商业服务平台,深耕质谱组学检测分析,具体包括空间代谢组、双平台代谢组、靶向代谢组、TMT标记定量蛋白组、翻译后修饰蛋白组、4D-DIA蛋白组、单细胞及超微量蛋白组、空间蛋白组等。创新质谱组学平台广泛应用于机制解析、分型诊断、标志物筛选、药靶发掘等多个领域。公司并先后获得高新技术企业、上海市专精特新企业并建有院士专家工作站,自有包括tims tof pro2在内的各类大型质谱近二十台套,年服务项目超2000项。鹿明生物协助合作伙伴发表SCI论文近千篇,成功打造以硬数据、好服务为基础,以空间代谢组为特色的质谱组学检测服务公司品牌。
END
蚂蚁无所谓 撰文
欢迎转发到朋友圈
本文系鹿明生物
转载请注明本文转自鹿明生物
我知道你在看哟
点“阅读原文”了解更多