Itegrative Genomics Viewer (IGV)是由Broad研究院的研究人员开发的一款功能强大的综合性基因组学可视化工具,借助于此工具,从事生物信息的科研工作者就可以轻松的分析查看多种基因组数据。除了直观的查看序列信息及遗传密码中的序列变化或突变外,还可以查看拷贝数变化、染色质沉淀数据和表观遗传学修饰等。使用者可以选择多种显示模式,以heat map、柱状图、散点图或其他形式查看他们的数据。更为吸引人的是IGV的使用是免费的哟!
测序数据reads通过与参考基因组比对可以直观的查看序列信息及遗传密码中的序列变化或突变,还可以查看拷贝数变化、染色质沉淀数据和表观遗传学修饰等。
前期准备工具:
IGV软件
参考基因组:例人参考基因组Homo_sapiens_HG19.sorted.gtf
测序数据文件:例bam、bw等
一、IGV下载及安装
1.请打开您常用的浏览器,在http://www.broadinstiute.org/igv/ (需注册)下载IGV(Integrative Genomics Viewer)。如果您不想注册,请使用直接地址下载适用于所有平台的二进制发行版,这可能需要几分钟。
2. 下载IGV_2.3.59.zip(或任何其他版本)后,首先解压文件,双击“igv.bat”。在你自己的电脑(windows系统)上运行IGV。需要一段时间初始化IGV(链接到web,下载一些基因组注释文件)。
二、操作步骤
1. 参考基因组文件导入
在IGV软件的储存中已经包含了部分的参考基因组信息,可以在方框1中下拉选择,如果有目标基因组可以直接点击,系统将自动下载并导入;如果没有的话,可以选择Genomes→Load Genomes From Files导入本地的基因组fa文件。
图1. IGV界面
2. 测序数据的导入
以bam或bw文件类型为例,导入路径:File→Load form File, 选择bam或bw文件;注意的是bam一定要sort,而且在bam文件所在的目录下一定要有bam文件对应.bai索引文件。
bam文件排序:samtools、sort、A.bam、A.sort
bam文件构建索引:samtools index A.sort.bam
导入后可以在方框2的位置选择感兴趣的染色体,也可以在方框3的位置输入感兴趣的基因组位置(格式:染色体:起始位置-终止位置),单击回车即可显示出所选区域的read的覆盖情况(方框4,5所示区域)。如果所选基因组过大,在read覆盖区会出现Zoom in to see coverage,此时可以通过点击方框6中的“+”或“-”号调整所展示的区域。如果想选择基因进行可视化,可以在方框3键入基因的位置,或者通过Regions→Gene Lists 来选择感兴趣的基因集,当然也可导入自己感兴趣的基因list。
图2. IGV结果展示
另外如图所示,方框4为Coverage track,表示的是该样品在基因组上的覆盖度,横坐标是基因组位置,纵坐标则是该位置上的测序深度。方框5对应的是该样品比对到参考基因组上read的track,每一条代表一个read,可以通过讲鼠标的光标移动到read位置,就可以显示比对详情,也可以直观的看到每个碱基是什么。当导入bw文件时只有方框4的内容为read的覆盖深度,所以想看read的比对信息还要用bam文件。
3. 可视化效果的调整
实际操作过程中,往往需要通过调整各种附加效果来美化图片或者达到目标杂志的要求,这时将鼠标光标移动到深度区域或者read覆盖区域单击右键,就会弹出一个下拉菜单,所对应的功能如下:
功能选项 |
含义 |
Rename Track |
更改track名 |
Change Track Color |
更改背景色,比如把Coverage Track灰色变红色 |
Change Track Height |
改变每一个track的高度 |
Change Font Size |
改变IGV最左侧字体大小 |
Set Data Range |
覆盖深度的范围设置 |
Log scale |
用对数尺度作图 |
AutoScale |
是否自动缩放 【根据不同区域的深度情况自动调整深度范围】 |
4. 保存图片
通过各种参数调整达到自己的审美要求时,就可以保存图片啦,单击鼠标右键选择Save image…功能即可。当然,后期我们还可以通过PS等美图软件进一步调整,以达到锦上添花的效果!
今天的技术分享就到这里了,您是不是也如小编一样收获颇多呢!如果您还想深入的挖掘更多有关IGV使用功能的信息,还可以直接通过IGV官网进行学习哟!