分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

生信小工具 | 手把手教你从序列查找开始,绘制漂亮的进化树

迈维代谢
2022.9.30

系统发育进化树(Phylogenetic tree)也叫系统进化树,它利用树状分支图形来表示各基因或物种之间的亲缘关系,是系统生物学研究中的重要手段。一个结构清晰、注释清楚、配色美观的进化树往往能为文章增添几分优雅气质。

在基因研究中,往往会通过进化树鉴定基因在种内及种间的基因亚族,探究目标基因可能行使的功能。那么如何绘制一个美观的进化树?下面就以拟南芥已报道的BAHD酰基转移酶基因为例,查找水稻BAHD酰基转移酶基因,结合常用的MEGA、AI(Adobe illustrator)、iTOL软件,给大家完整演示进化树的制作。

1.同源基因序列查找(如果已经准备好基因序列了可以跳过此步骤)

https://plants.ensembl.org/index.html,

进入

粘贴已报道的拟南芥BAHD基因蛋白序列,运行BLASTP:

运行完成后分别下载每一个比对结果,第一列是比对到的水稻转录本ID,经过筛选去重后,得到水稻中比对同源性高的水稻BAHD基因号,然后通过BioMart在线工具获得这些基因的蛋白序列信息。

BioMart工具中,设置选择水稻基因组,并利用上一步中比对后去重到的水稻转录本ID作为Filter标准,获得水稻对应转录本的蛋白序列信息:

这样我们就利用拟南芥报道的BAHD酰基转移酶基因,通过在线工具,查找到了水稻BAHD酰基转移酶基因及序列信息。将它们整理合并成.fa格式,用于后续进化树分析。

2.多重序列比对

https://www.megasoftware.net/

官网下载安装MEGA软件,导入整理好的蛋白或核酸序列,利用MEGA里整合的clustalW和MUSCLE插件进行多重序列比对,如下图所示:

选择多重序列比对软件和参数(以MUSCLE为例)

保存为.mas或.masx格式的结果文件,此时多重序列比对就完成了

3.构建进化树

关闭当前窗口,回到主界面,

运行完毕后会自动弹出进化树界面,此时进化树就构建好了,保存为兼容性强的Newick(.nwk)格式文件,可以用多种工具打开进行美观性调整和注释:

4.MEGA进化树美化

进化树默认矩形展示,当基因比较多的时候,进化树如下图所示,既不美观,也几乎看不到细节:

我们用MEGA打开进化树,在功能面板上选择环形展示、仅展示拓扑结构、设置字体大小,进化树就变的清晰明了:

此时如果想要标注出关注的基因,可以在格式工具里,对标签设置形状和颜色标注,同样还可以设置树枝线的粗细、相对长度等。这样就得到了一个比较美观的圆形、带标记的进化树:

最后,导出PDF或SVG格式矢量图:

5.AI(Adobe illustrator)美化

MEGA的进化树标注功能有限,比如无法添加区块颜色,不能自由添加文字标注,而这些需求在我们获得矢量图之后,可以使用AI软件自由实现,使用AI打开保存的进化树矢量图。初始效果如下,里面的文字、线条、标记等元素皆可选中,用小工具进行调整:

那么我们如果复现示例图1里的那种不规则区块背景,只需要曲率工具就可以实现:

然后设置不规则形状的填充颜色、透明度,并置于底层:

依次添加,然后用直接选择工具拖拉不规则形状上的锚点,可以对形状进行微调:

最后使用文字工具,添加注释文本,保存即可:

那么我们就得到了一个包含个性化颜色、文字注释的圈状进化树,如下所示:

6.iTOL在线交互工具

iTOL(Interaction Tree Of Life:http://itol.embl.de/)是一个集在线展示、注释和管理进化树的交互工具。绘图过程中可以随意调整树枝、标签的颜色、形状和字体,发布以来广受好评。

使用也很简单,首先,注册并上传我们前面得到的nwk格式的树文件:

比如,我们可以

 

另外,官方也支持上传进化树注释(Tree annotation)文件,对进化树添加注释,感兴趣的同学可以参考官方帮助文档:

https://itol.embl.de/help.cgi#annot

及示例注释文件:

https://itol.embl.de/help/example_data.zip

下面以label颜色设置+外圈色块注释为例。首先,准备两个excel表格,格式如下:

将这两个表格分别保存在两个txt文本文件中,上传至iTOL上打开的进化树,即可获得包括label颜色设置+外圈色块注释的进化树,如下所示:

此时,目标进化树就生成了,还可以通过控制面板调整注释细节。

松针状进化树也可以通过Basic-->unrooted设置获得:

最后就是数据导出了,有多种格式可供选择,建议选择矢量图,后续还可以用AI进行个性化调整。

99%的代谢组学研究者都在阅读下文:

●蛋白专题合集

●Biomarker专题合集

●空间代谢组合集

●肠道菌群&微生物专题

●小小果蝇竟暗藏玄机?高通量测序揭示黑腹果蝇样本疾病相关蛋白调节神经元形态的机制

●迈维云平台系列课操作教程,公号回复“迈维云”即可

客服微信:metware888

咨询电话:027-62433042

邮箱:support@metware.cn

网址:www.metware.cn

我就知道你“在看”

发布需求
作者
头像
仪器推荐
文章推荐