分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

蛋白质组学专题 | 一文教你如何选取蛋白数据库以获取高质量数据

迈维代谢
2022.12.23

3748559d60b676d6ffb3a79bb993747d.gif

获取样本后,经过蛋白提取、还原烷基化、酶解等前处理后质谱检测,最终会得到肽段的二级谱图,那如何对谱图解析并进行蛋白鉴定呢?此时需要将谱图与数据库检索,即用理论的肽段二级谱和实验的前体离子二级谱循环比对。由此可见理论肽段二级谱图非常重要,直接影响最终蛋白鉴定结果,因此选择合适的蛋白数据库非常重要,直接影响最终蛋白组数据质量。


6dd9ccc802a11fa4d87c70293aef06ed.png

    

谱图匹配示意图

PART

01
蛋白组数据库来源

物种蛋白数据库简单来说即物种蛋白氨基酸序列信息,部分物种蛋白数据库可直接在相应网站检索下载,如Uniprot数据库、NCBI网站Taxonomy板块等,部分物种有专有蛋白数据库,如水稻、油菜花等。


部分物种无现有蛋白数据库,是否还能做蛋白组?如有全基因组数据,可将CDS区转换为氨基酸序列,从而进行蛋白组研究。若有相同组织转录组数据,也可利用三框翻译原则转换为氨基酸序列进行蛋白质组学研究。


b9eb95901b3bdb50a685e27d07adf269.png

    

蛋白质组数据库来源

PART

02
蛋白组数据库选择原则

●蛋白质组学研究时蛋白数据库必不可少,优先推荐使用Uniprot数据库https://www.uniprot.org/),Uniprot数据库是信息最丰富、资源最广的蛋白数据库,一般可在Uniprot查阅相应物种蛋白数据库并下载。若Uniprot无相应物种,可查阅NCBI、Enesmbl数据库并下载。


●若数据库无相应物种,研究者有相应物种基因组信息,可将CDS区翻译为氨基酸序列,以此作为蛋白数据库进行蛋白鉴定。


●若蛋白相关数据库无相应物种,仍然想做蛋白组研究,可将相同样本进行转录组检测,根据无参转录组信息转化为氨基酸序列信息,以进行后续分析,另外也可选取近缘物种蛋白数据库信息进行后续分析。但无论是转录组转换来的蛋白数据库还是近缘物种数据库对于蛋白鉴定效果都不理想,为迫不得已的选择。


d9bd04a1f7b774a55b64a6fe96ee4dc5.png


PART

03
Uniprot物种蛋白数据库搜索指南

首先打开Uniprot官网,映入眼帘的是搜索界面和4大功能板块UniProt knowledgetbase(UniProtKB)、Proteomes、UniParc、UniRef。UniProtKB包含两个子数据库Swiss-Prot和TrEMBL数据库。Swiss-Prot数据库是高质量、人工注释、非冗余数据库,人蛋白组分析通常会使用此数据库,以此提供高质量人蛋白组数据。TrEMBL数据库是高质量计算机分析的结果,但未经人工校验。UniParc归档库主要作用为去冗余,将不同数据库同一蛋白归并。


86af252bc6b4217403cba7781888ff0c.png


Proteomes蛋白组主要是收集已经完成全基因组测序物种的核酸序列翻译所得的蛋白质序列,在进行蛋白组分析时,需从此板块搜索相应物种,并下载蛋白数据库,具体步骤如下。


1. 选择Proteomes,输入物种名称

c2fe575236d7dcf6dab9e665f4224637.png


2. 选择对应物种蛋白数据库

cbf56255b8ca8356833ebf1d375ff954.png


3. 点击下载FASTA格式蛋白数据库

88b26e3992b8a2d6b3f29896d8710c26.png

备注:若老师选择迈维代谢做蛋白组学检测,可不用下载蛋白数据库信息,提供物种在Uniprot中的ID即可。

PART

04
NCBI物种蛋白数据库查找指南

部分物种在Uniprot中无法查到相应数据库,研究者可尝试在NCBI查找并进行后续分析,具体查找步骤见下文。

1. 打开NCBI网页,选择Taxonomy,输入物种

15c52c25325d68fee4312d6ad7c21d79.png

2. 进入物种界面,点击Protein链接

物种搜索完后会出现很多跳转链接,一直点击相应物种链接,直至出现下图。若老师选择迈维代谢做蛋白组学检测,可不用下载蛋白数据库信息,提供物种Taxonomy ID即可。

825578365988db3d6e1e33162725f61a.png

3. 进入物种界面,点击Download,选择Proteins下载即可

f039a21e6d518e02639a452ce7810439.png

PART

05
迈维总结

看完本文相信各位对如何查找物种蛋白数据库有了一定了解,那Uniprot作为蛋白质组学研究重要数据库,不仅可提供物种氨基酸序列信息进行蛋白鉴定,还可查询蛋白功能进行数据挖掘,如蛋白功能描述、GO注释、亚细胞定位、组织特异性等,如需详细了解,可继续关注迈维代谢。


另外迈维代谢可提供领先的蛋白质组学服务,采用最先进的蛋白质组学仪器timsTOF Pro2进行4D蛋白质组学实验,提供优异的蛋白质组学数据,如有需求可联系小迈。


c574018d49ae6e9f68a66360b95d9a80.jpeg

039e74882c7f82143b53afcc89ee52d4.gif

99%的代谢组学研究者都在阅读下文(精彩合集,欢迎收藏):

项目文章 | Nature子刊:新发1型糖尿病患儿肠道菌群的功能和代谢变化

风味代谢组 | 迈维代谢科研PI应用创新分析思路连发三篇高分文章揭示“真香”机制

激情世界杯,追逐科研梦 | 转录组+代谢组数据挖掘与R语言培训班

蛋白专题合集

Biomarker专题合集

空间代谢组合集

肠道菌群&微生物专题

生信小工具专题


dd1da880f326199174e2a9dfc7faa6fe.jpeg

996a75f323f9b291e084199f8a4c24aa.gif

客服微信:metware888

咨询电话:027-62433042

邮箱:support@metware.cn

网址:www.metware.cn

我就知道你“在看”

248cd138ef1f8b06443d5d745bbb25e9.gif

发布需求
作者
头像
仪器推荐
文章推荐