分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

生信小工具 | 手把手教你从序列查找开始,绘制漂亮的进化树

迈维代谢
2022.9.30

64b9af0ac60f99d24d90cbb714f884cd.jpeg


系统发育进化树(Phylogenetic tree)也叫系统进化树,它利用树状分支图形来表示各基因或物种之间的亲缘关系,是系统生物学研究中的重要手段。一个结构清晰、注释清楚、配色美观的进化树往往能为文章增添几分优雅气质。


56052e7887b81db43da6cdac9e48dbd5.png
2daee668e2dc9aeca5d66c784f15dc14.png



85ddcd71f10079652f8d0961e6259b93.png


在基因研究中,往往会通过进化树鉴定基因在种内及种间的基因亚族,探究目标基因可能行使的功能。那么如何绘制一个美观的进化树?下面就以拟南芥已报道的BAHD酰基转移酶基因为例,查找水稻BAHD酰基转移酶基因,结合常用的MEGA、AI(Adobe illustrator)、iTOL软件,给大家完整演示进化树的制作。


1.同源基因序列查找(如果已经准备好基因序列了可以跳过此步骤)

https://plants.ensembl.org/index.html

进入点击选择水稻基因组及注释,然后选择在线BLAST:

a4ae590ff0cfb4bc213bce730e85b2f2.png


粘贴已报道的拟南芥BAHD基因蛋白序列,运行BLASTP:


08845b197d2b0b6f36f4a695cb94d3ee.png

运行完成后分别下载每一个比对结果,第一列是比对到的水稻转录本ID,经过筛选去重后,得到水稻中比对同源性高的水稻BAHD基因号,然后通过BioMart在线工具获得这些基因的蛋白序列信息。


2d0d95a82e54558231640dd45f831992.png


BioMart工具中,设置选择水稻基因组,并利用上一步中比对后去重到的水稻转录本ID作为Filter标准,获得水稻对应转录本的蛋白序列信息:


046136570d38044bf5983a94cc48e9a3.png

b8c141ab4bd69ec94d6b81311ccd2462.png


这样我们就利用拟南芥报道的BAHD酰基转移酶基因,通过在线工具,查找到了水稻BAHD酰基转移酶基因及序列信息。将它们整理合并成.fa格式,用于后续进化树分析。



2.多重序列比对

https://www.megasoftware.net/

官网下载安装MEGA软件,导入整理好的蛋白或核酸序列,利用MEGA里整合的clustalW和MUSCLE插件进行多重序列比对,如下图所示:


ef6d4c8b03d425d41b0070f3687b1357.png


选择多重序列比对软件和参数(以MUSCLE为例)


837bdfc6fc14e12538ed798aca62d0d7.png


保存为.mas或.masx格式的结果文件,此时多重序列比对就完成了


7a2d8f518bd2d26961d1453db77461a2.png


3.构建进化树

关闭当前窗口,回到主界面,点击PHYLOGENY,此时有多种构建进化树的方法可供选择,下面以领接法(Neighbor-Joining)为例:


f228a230a9f3eff65d2a582433bfea19.png


运行完毕后会自动弹出进化树界面,此时进化树就构建好了,保存为兼容性强的Newick(.nwk)格式文件,可以用多种工具打开进行美观性调整和注释:

99d260fd6937b058db89e4bb07d935e5.png



4.MEGA进化树美化

进化树默认矩形展示,当基因比较多的时候,进化树如下图所示,既不美观,也几乎看不到细节:

025a9338f853759ef628e7a1b79a13b0.png


我们用MEGA打开进化树,在功能面板上选择环形展示、仅展示拓扑结构、设置字体大小,进化树就变的清晰明了:


7b1948689b33b2e4f141d6545062b4d8.png


此时如果想要标注出关注的基因,可以在格式工具里,对标签设置形状和颜色标注,同样还可以设置树枝线的粗细、相对长度等。这样就得到了一个比较美观的圆形、带标记的进化树:


1755bfced210e5bee1e394dac35c0c2e.png


最后,导出PDF或SVG格式矢量图:

4e6ef52084c98088f9bdcc2f40ce2d5a.png


5.AIAdobe illustrator美化

MEGA的进化树标注功能有限,比如无法添加区块颜色,不能自由添加文字标注,而这些需求在我们获得矢量图之后,可以使用AI软件自由实现,使用AI打开保存的进化树矢量图。初始效果如下,里面的文字、线条、标记等元素皆可选中,用小工具进行调整:


f37bafb2793706f929dc9dd265fffca0.png


那么我们如果复现示例图1里的那种不规则区块背景,只需要曲率工具就可以实现:

7235eece4d1cf2824e19878fddcb142e.png


然后设置不规则形状的填充颜色、透明度,并置于底层:


0c86d40271bb1f44717e437a852c21d3.png


依次添加,然后用直接选择工具拖拉不规则形状上的锚点,可以对形状进行微调:

0eaa8751edb408631cb6bb95448caac6.png


最后使用文字工具,添加注释文本,保存即可:

4b53b8e8271fed86d2547729fde6e27b.png

那么我们就得到了一个包含个性化颜色、文字注释的圈状进化树,如下所示:

d4035d10f45845ef5eea4efe2f40009c.png


6.iTOL在线交互工具

iTOL(Interaction Tree Of Life:http://itol.embl.de/)是一个集在线展示、注释和管理进化树的交互工具。绘图过程中可以随意调整树枝、标签的颜色、形状和字体,发布以来广受好评。


使用也很简单,首先,注册并上传我们前面得到的nwk格式的树文件:


ec844fcd8ae28a5eb98d85852db86b3f.png

点击树文件之后,自动链接到主界面的圈状树。点击树枝可以针对某一树枝修改树枝和标签的大小、颜色等;左侧快捷按钮可添加文字注释、形状;控制面板的操作按钮也很多,用于全局设置进化树类型、标签和树枝的字体、大小、颜色等。

f409fd7d5954548cf7a23c0bdbb0baf9.png


比如,我们可以点击进化树,将不同树枝的标签添加不同的背景色:

119f48f3db8bb7a6ae26133c6b25efb8.png 

另外,官方也支持上传进化树注释(Tree annotation)文件,对进化树添加注释,感兴趣的同学可以参考官方帮助文档:

https://itol.embl.de/help.cgi#annot

及示例注释文件:

https://itol.embl.de/help/example_data.zip

下面以label颜色设置+外圈色块注释为例。首先,准备两个excel表格,格式如下:

58f8f9f2b6c587c862cad2c618b7a338.png


将这两个表格分别保存在两个txt文本文件中,上传至iTOL上打开的进化树,即可获得包括label颜色设置+外圈色块注释的进化树,如下所示:

8881d1ad12f587db2949781013775634.png


此时,目标进化树就生成了,还可以通过控制面板调整注释细节。

30bcfb29cfe8ce8194b33ac1091d3e64.png


松针状进化树也可以通过Basic-->unrooted设置获得:

a20563288bbcc45fb3324fa43c7e69d5.png


最后就是数据导出了,有多种格式可供选择,建议选择矢量图,后续还可以用AI进行个性化调整。

9e40858dd9d7261c617128d84ee4c6c3.png


40d6766c77f7d90652e72478bcd63b16.gif

99%的代谢组学研究者都在阅读下文:

蛋白专题合集

Biomarker专题合集

空间代谢组合集

肠道菌群&微生物专题

小小果蝇竟暗藏玄机?高通量测序揭示黑腹果蝇样本疾病相关蛋白调节神经元形态的机制

迈维云平台系列课操作教程,公号回复“迈维云”即可


dd1da880f326199174e2a9dfc7faa6fe.jpeg

c65bc85ecb7abb494809b2ceee852e77.gif

客服微信:metware888

咨询电话:027-62433042

邮箱:support@metware.cn

网址:www.metware.cn

我就知道你“在看”

ce6672643e7f3df337cca18f212c6bcb.gif

发布需求
作者
头像
仪器推荐
文章推荐