返回
首页 厂商新闻

APT干货分享||UniProt数据库怎么看?

拿到蛋白质组学鉴定结果后,看懂数据库当然是第一步的。这个时候,APT技术编登场了,教你怎么轻松看懂数据库!

1585751280660567.gif

以常见的牛血清白蛋白(BSA)为例,首先下载BSA的数据库信息↓↓↓

1585751103229833.png

纳尼,前方出现一波天书,别担心别恐慌,听我慢慢道来。

首先sp表示Swiss-Prot,Swiss-Prot数据库是注释精炼的蛋白序列库,它的所有序列都经过了科学家的查阅文献核实(reviewed, manually annotated) 。

P02769是蛋白在uniprot上的ID号,即蛋白的身份证号。

ALBU_BOVIN是蛋白在uniprot上的登录名,跟P02769是一个作用。

Serum albumin是蛋白名称,即蛋白的姓名啦。

天书再次飘过,出现一系列缩写,继续了解:

OS表示Organism,也就是物种名称,数据库中的物种名称一般为拉丁名称,牛血清白蛋白Bostaurus当然是牛的拉丁。

GN表示gene name,即基因名称。

PE表示ProteinExistence,即蛋白的可靠性,PE=1、2、3、4、5分别对应如下,可以看出数字越小可靠性越高:

1. Experimental evidence at protein level

2. Experimental evidence at transcriptlevel

3. Protein inferred from homology

4. Protein predicted

5. Protein uncertain

SV表示SequenceVersion,即序列版本,即蛋白的身份证第二代,第三代……

这里需要指出的是,除了sp,有时还会出现下图的情况。

1585751180659842.png

唯一不同的只有Tr,这里Tr表示TrEMBL,TrEMBL数据库全称“Translation of EMBL”,是从EMBL中的cDNA序列翻译得到的,其中TrEMBL收录的是未经人工注释的编码DNA序列翻译数据。(unreviewed, automatically annotated),不难看出,相比之下,sp数据库更可靠。

登陆uniprot官方网站(http://www.uniprot.org/,见截图)即可看到,目前uniprot网站收录的sp数据库有554241条蛋白条目,tr数据库有84827567条。当然这一数据每天都有更新。更多数据库参考信息相关链接:http://www.uniprot.org/help/uniprotkb

1585751216371646.jpg

 

好啦,小编今天就说到这儿,是不是感觉意犹未尽呢~别急,APT会逐步给老师同学们带来文献解读,解惑答疑,行业热点等等等一手的干货,所以要请大家多多关注咯~

同时,APT“夏季培训班--SCI文献中的代谢组学技术应用”正在火热招生中,感兴趣的不要错过哦,甩链接报名:中科新生命夏季培训班第二轮通知

(扫一扫,我们都是好朋友❤)

640?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1

中科新生命,成立于2004年,专注于质谱技术方法在科技服务、生物医药、精准医疗领域的应用开发。12年质谱服务经验,每年处理本数超万例,通过与中科院的技术合作及企业研发团队的自主创新,致力成为您优秀的生物技术合作伙伴。

责任编辑:webmaster
近期热点新闻
0
展台

咨询