分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

欧易组学联合流程上新了,高达8款!

创新多组学技术服务
2023.6.05

dca8951f17a0781f1512fb6a05f3115b.gif


330322fc607d04ba50e9b1cbbfd555e5.png


还在为多组学数据联合分析发愁吗?如果屏幕前的你正在被这一问题困扰,那千万不能错过本文的分享。欧易生物目前为止更新了8款组学联合流程,对逻辑框架,内容丰富度、图片美观度、报告可读性都做了较大幅度提升甚至革新,满满的干货,快来一起学习吧!


5f95986eaf1ff81da4d03d4ebc6ef414.png


当前欧易组学联合更新流程涵盖8款,分别为微生物代谢、宏基因组代谢、转录代谢、蛋白代谢、宏基因组转录、微生物转录、转录蛋白以及三组学转录蛋白代谢。


欧易生物组学联合分析使用多种方法,包括样本分群分析、生物标志物筛选、以及相关性分析等,并结合机器学习,从统计学和生物学的角度出发以更全面的视角来理解样本、不同组学差异特征之间的关系,并对相关结果进行丰富多彩的可视化呈现。


首先,我们对不同组学的数据使用使用PCA和LDA两种降维方法进行样本分群分析,并对PCA降维后的数据采用层次聚类的方式展示了样本间的关系。如果不同组间的样本具有明显的差异,这种差异可以通过线性拟合投影的方式展示出来。样本分群分析不仅可以帮助我们更好地理解样本之间的关系,还可以为后续的生物标志物筛选提供重要依据。下图为LDA、PCA降维结果,从图上两个坐标系可以直观看出,组内样本点距离越近,组间样本距离越远,说明样本质量、降维效果好。


933654e898f13c5eb787dc427953b706.png


bff3032bc6ec89eb0bb201786ddfdeb4.png


对 PCA 降维后的数据进行层次聚类,可以更明显地看出组内样本更为相似。


cfd1c342e86ce07460278f729c3fe0e2.png

为了评估多组学特征在样本分组中的作用,我们使用了随机森林模型进行生物标志物筛选。选取出biomarker之后,进行数据处理并进行模型构建,采用ROC曲线评价其分类效果。本文中,我们选择top30的重要的生物标志物来重新构建随机森林模型,下图为top30特征展示。


b1c68fa6316317081138fcf4b4977239.png


利用这30个biomarker,再次构建随机森林模型,并输出下图所示关于测试集的ROC曲线。ROC曲线可直观理解为,曲线下方的面积(AUC)越大,模型的分类性能越强。通过这种方法,我们得到了高质量的生物标志物,为后续的研究提供了有力的支持。


720a8ba0c02d6478b2006cc75a82f985.png


对不同组学数据进行筛选,使用pearson/spearman等方法进行相关性分析,计算组学数据之间的相关性系数,并绘制相关性分布图。取值大的相关系数越多,说明组学整体的相关性较强。通过相关性分析,我们可以更好地理解不同组学特征之间的关系,为后续的研究提供重要参考。


d2a1f82af6223552b268532511ed76bd.png


热图是一种直观的可视化工具,通常用于表示不同组学特征在不同样本或条件下的表达或浓度变化。通过下图中的热图,我们可以直观地观察到转录组和代谢组之间的相关性,并且可以通过聚类分析等方法进一步挖掘数据中的规律和趋势。


4a78bb2f089efc5c55217f934f40cbbb.png


与热图不同,网络图可以更好地呈现复杂的生物学关系。在下图中,我们构建一个基于基因和代谢产物之间的相关性关系的网络图。通过网络图更好地理解不同组学特征间的相互作用以及关系等信息。


6efff4cb311854b876d21dae03c3217a.png


此外,我们还对不同组学差异特征的功能(KEGG)进行整合,主要针对多组学差异特征进行分析,结果包含组学差异物通路的 VENN 分析、差异基因/蛋白和差异代谢物的通路映射,通路上下游互作KGML。将不同组学的差异特征向 KEGG pathway 数据库映射,获得它们共同富集的通路。将同时有多组学差异特征的通路挑选出来,并进行通路上色。通过该分析可视化结果,可以找到两个或多个组学之间的关联通路,并了解这些通路在不同组学之间的差异表达情况以及它们之间存在的相互作用和调节关系。


76c744e1453afc7781ea73aada269491.png


为了更加系统地研究两个组学之间的功能相互作用,进一步基于 KGML 文件进行通路上下游互作分析。通过 KGML 文件得到两个组学的差异特征所在通路之间的联系,并通过将这些通路之间的联系绘制成网络,可以更好地了解多组学当中共同变化的信号通路的相互作用。


f577ee7fb15582c54df43e37a1baa726.png


根据基因和蛋白的表达量绘制九象限图,直观展示基因、蛋白的上下调和差异表达情况。不同颜色的点代表不同的基因、蛋白:九象限图中灰色圆点代表基因蛋白都非差异,紫色圆点代表基因蛋白同时上调,蓝色圆点代表基因蛋白同时下调,红色圆点代表基因下调蛋白质上调,绿色圆点代表基因上调蛋白质下调。深颜色表示基因、蛋白同时显著上/下调,浅颜色表示基因或蛋白非显著上下调(下图为转录蛋白联合特有)


91a76bdbbb080300ef11d773b6f7b227.png


通过将不同组学共同上调、共同下调、单独差异、趋势相反的基因/蛋白集进行通路富集,并对其功能进行描述。下图从四个维度展示通路富集信息,其中横轴 Enrichment Score 为富集分值,气泡越大的条目包含的差异蛋白编码基因数目越多,气泡颜色由蓝-白-黄-红变化,其富集 p-value 值越小,显著程度越大(下图为转录蛋白联合特有)


bba80638d6d1129599b330758e3063ee.png


为了探索基因-蛋白间的相关性,在二者的联合分析中,我们还计算了每个基因-蛋白关系对之间的相关性系数,并按系数大小以横向柱状图的形式进行展示(下图为转录蛋白联合特有)


2b78c6fe05d18fb48088f8b98503ce7e.png


除了柱状图可视化,我们还提供转录组和蛋白质表达水平的样本聚类热图展示,其中RNA和蛋白一一对应(下图为转录蛋白联合特有)


c55d6cb936adbad16d9e9d094ed83c76.png


最后,对于转录、蛋白、代谢三组学的联合分析,使用 mixOmics 分析同时整合多组学数据,展示不同组学两两间在第一成分上对当前分组的区分度。下图中,下三角为各组学间第一成分的皮尔森相关性系数,上三角为各组学在第一成分上的散点图,既能体现不同组学之间的相关性,又能展示组内间的差异(下图为转录蛋白代谢三组学联合特有)


502c055a1b4ad93531519c60d6d1bb09.png


浏览完本文的可视化盛宴,您是否对多组学联合分析方向有了一定的概念呢?是否对我们的生信分析可视化呈现产生了一定的兴趣呢?我们提供组学联合全面的生物信息分析报告,既有生物学支持,也有统计学方法,对于理解多组学数据的相互关系,以及发现重要的生物标志物,都具有重要意义。在此,我们希望新版组学联合报告可以为您的研究提供帮助,同时也欢迎您随时联系我们,以获得更深入的分析结果。如果感到心动,那就快快行动吧!


c77a39c0f69db7b0ecef8a0af602f417.png

上海欧易生物医学科技有限公司(简称:“欧易生物”),成立于2009年,经过十多年稳健发展,已经成长为拥有“晶准生物”“鹿明生物”“青岛欧易”三家全资子公司,近600名员工的生物科技领域集团型企业。


欧易生物始终秉持着“硬数据 · 好服务”的理念服务于大众。为大生命科学、大健康相关研究领域,以及医药、食品及日化企业的客户,提供从基础研究到药物靶点发现、药理药效及安全性评价、疾病分子标志物筛选、致病菌及耐药菌溯源等相关技术服务,全力加速客户研究与开发进程,提升客户研究与开发价值。

5758cb5d241b7f68c50e4b0cee8e62a7.png


欧易生物携手旗下子公司,实现了中心法则上、中、下游多层组学的串联,从基因组、转录组、表观组、微生物组,到蛋白组、代谢组及近年热门的单细胞&空间多组学技术服务,为科研用户提供全面的创新多组学技术服务。


21262fb671b07c3db836e00aab1bb012.png


欧易生物已先后获得上海市科技小巨人企业、闵行区研发机构、闵行区企业技术中心、产权管理体系认证企业等资质。拥有授权发明专利30+项,在受理发明专利50+项,软件著作权150+项。

fd06fa9c0a16172e49303e7650d29e14.png
bb09cfdf21ade50f4be2b6457f679fa2.png

END

排版人:七七


原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。

c0cfed50fbe1b20043b07460b6890d94.gif
60742baa426372a9b17ac5c25d775121.gif

发布需求
作者
头像
仪器推荐
文章推荐