蛋白组学、代谢组学服务专家
生物信息分析知多少?
Do you know
在生信分析中,我们常会接触到各个因素之间的关系,这些变量之间的关系往往不能进行解析描述,不能由一个(或几个)变量的数值精确地求出另一个变量的值,这称为非确定性关系(或相关关系)。
而相关散布图就是用来研究两个变量之间是否存在相关关系的一种图形。它是用非数学的方式来辨认某现象的测量值与可能原因因素之间的关系。这种图示方式具有快捷、易于理解的特点。要注意的是,绘图数据必须是成对的(X,Y)。根据点的分布特点,就可以判断x和y 的相关情况。在生物统计中有许多呈规则或不规则的关联,我们要了解它,就可借助散布图统计手法来判断它们之间的相关关系。
一起绘制出这张相关散布图吧!
Do you know
01
首先安装接下来绘图所需的R包
library(ggplot2)library(ggpubr)library(readxl)
向右滑动查看全部
02
然后读取两个表格内容
#该表格是样本中代谢物的表达量数据。data_expression<-read_excel(“expression.xlsx”,sheet=1)
向右滑动查看全部
#该表格是样本中物质浓度数据。data_potency<-read_excel(“potency.xlsx”,sheet=1)
向右滑动查看全部
03
提取所需数据
#分别选取一种代谢物和一种物质浓度expression <- data.frame(data_ expression [1], data_ expression [2])potency <- data.frame(data_potency [1], data_potency [2])
向右滑动查看全部
04
对数据进行处理
根据样本名合并表达量矩阵和浓度矩阵
#merge()获取两个不同数据框中交叉部分data <- merge(x = potency,y = expression ,all = T,by = "Sample_name") #提取新矩阵列名col_names <- colnames(data)
向右滑动查看全部
05
绘制相关散布图
以浓度1作为横坐标,Metabolites1作为纵坐标绘制相关散布图。
ggplot(data,aes(x = data[,2],y = data[,3])) + theme_bw() + #设置散点颜色和大小 geom_point(color = "black",size=2) + # lm函数可对两组数据进行回归分析,使用geom_smooth()来画曲线拟合图 geom_smooth(method = "lm",color = "royalblue1") + #使用Pearson相关分析 stat_cor(data = data,method = "pearson",size = 6) + #设置横纵坐标名和标题 labs(x = col_names[2], y = col_names[3],title = "correlation") + #设置标题格式 theme(plot.title = element_text(hjust = 0.5, size=20))+ #设置坐标轴和坐标轴名称格式 theme(axis.text = element_text(size = 12,face = "bold"), axis.title = element_text(size = 15,face = "bold")) + #设置绘图边距#设置绘图边距 theme(plot.margin = unit(rep(2,4),"lines"))
向右滑动查看全部
可以得到有关Metabolites1和浓度1的相关散布图。
06
对所有数据进行for循环绘制图片
for (i in 2:4){ #提取表达量数据 expression <- data.frame(data_expression [1],data_expression [i]) for (j in 2:3){ #提取浓度数据 potency <- data.frame(data_ potency [1],data_ potency [j]) data <- merge(x = potency,y = expression,all = T,by = "Sample_name")col_names <- colnames(data) pp<-ggplot(data,aes(x = data[,2],y = data[,3])) + theme_bw() + geom_point(color = "black",size=2) + geom_smooth(method = "lm",color = "royalblue1") + stat_cor(data = data,method = "pearson",size = 6) + labs(x = col_names[2], y = col_names[3],title = "correlation") + theme(plot.title = element_text(hjust = 0.5, size=20))+ theme(axis.text = element_text(size = 12,face = "bold"), axis.title = element_text(size = 15,face = "bold")) + theme(plot.margin = unit(rep(2,4),"lines")) #导出图片 ggsave(paste0("correlation-",i-1,"-",j-1,".jpg"), height=10, width=14, plot=pp) ggsave(paste0("correlation-",i-1,"-",j-1,".pdf"), height=10, width=14, plot=pp) }}
向右滑动查看全部
所有代谢物和物质浓度之间的相关散布图就这样绘制出来啦。
好了,这期关于相关散点图的分享就到这里结束了,请大家持续关注我们,后续还会有更多更实用的分享推出,帮助您在科研的道路上“披荆斩棘,乘风破浪”,实现您的科研梦想!
文末看点 | lumingbio
上海鹿明生物科技有限公司多年来,一直专注于生命科学和生命技术领域,是国内早期开展以蛋白组学和代谢组学为基础的多层组学整合实验与分析的团队。目前在多层组学研究已经有了成熟的技术方法,欢迎各位老师前来咨询哦~
同时,鹿明生物B站上线了5大频道板块,分别在空间代谢组学、生信分析、多层组学、代谢组学方向为各位科研老师提供有效的方法工具和思路~其中,生信板块也拥有着观看量1.5万的生信爆款视频~欢迎各位老师访问,鹿明生物B站:
https://space.bilibili.com/388691543
长按扫码咨询鹿明生物
技术工程师
项目咨询|样本咨询
猜你还想看
◆生信作图:高效学会富集分析气泡图,还能免费领取高清总代谢通路图哦~
◆生信作图:上镜率持续走高的桑基图,如何用多种方法绘制?(附代码)
◆生信作图:告别俗套相关性图,助您文章锦上添花!
◆生信作图:拒绝“菜色”,如何绘制高级且美丽的箱线图?(代码分享)