分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

超详细教程 | 一步步教你将蛋白质组数据轻松上传到公共数据库iProX

吉凯基因
2021.9.22

蛋白质组学技术作一项主流的研究技术,许多科研工作者在进行涉及到蛋白质组学的研究成果的投稿时,大部分主流杂志都需要作者在第三方平台上提交蛋白质组的原始数据作为实验数据支持。近期,吉凯基因的多位客户在投稿蛋白质组学文章时也遇到了这类要求。那么问题来了,你知道怎么上传原始数据,上传到哪个数据库,都需要上传哪些数据吗?

目前储存蛋白质组数据的公共数据库有好几个,比如ProteomeXchange和iProX。今天我们选择iProX作为本次示例的上传数据库。

iProX,是一家建立在中国本土基于质谱技术的蛋白质组学原始数据与知识共享平台,是ProteomeExchange中国区的联盟网站。iProX旨在支撑国内蛋白质组学项目对数据分析、管理和共享的需求,并促进蛋白质组学资源在世界范围内的共享。iProX由蛋白质组数据提交系统和蛋白质组学数据库组成,注册用户可以以公开或私有两种方式向iProX提交数据,一旦相关论文发表后,数据集将自动公开。

通过iProX共享平台提交蛋白质组学数据的步骤如下:

第一步 · 注册与登录

step one

首先输入网址链接(http://www.iprox.org/)进入主页,

第二步 · 创建项目

step two

登录系统后,用户可以直接通过首页上方“Project-New Project”的方式创建新项目;或者通过选择“My Space”,然后在Project Tree下方

创建新项目方法一

创建新项目方法二

iProX提交系统以项目为数据管理单位的(相当于一次完整的实验研究),一个项目下可以有多个子项目(多次实验结果)。可以认为一个子项目为一个项目下面的一次实验;如果没有重复/对照等不同类型的实验,一个项目下面可以只有一个子项目。

第三步 · 注册与登录

step three

项目信息填写页面如下图所示。页面上的导航栏显示了iProX系统中完整的数据提交过程,基本步骤包括:创建项目、创建子项目(一个/多个)、在子项目下上传数据文件、提交项目(包括下面所有子项目)。

(一)其中“Project ID”及“Proteomexchange ID”是系统自动生成的,不需要填写;另外页面中带“*”的为必填项,其他内容为选填项。

(二)is Public:选择项目(包括下面子项目)共享权限,“public”为立即向公众公开,“To be public”用户可以选择数据公开的时间,“private”为暂不公开(直到用户修改权限后才公开)。

(三)Add to Groups:将项目(包括下面子项目)共享到选择的群组,选择后,即使是“private”的项目和子项目,也对该group成员公开。

(四)Add to subprojects:将项目(包括下面子项目)添加到选择的超项目,选择后,项目和子项目的实验元信息可通过超项目浏览,但项目和子项目数据的访问权限同“isPublic”中的选择。

(五)填写完信息后点“Continue”保存当前填写信息进入下一步。

第四步 · 创建子项目

step four

iProX系统是以项目为数据管理单位的(相当于一次完整数据提交),一个项目下可以有多个子项目(多次实验结果,之间有关系,如对照实验或重复实验)。完成项目信息填写后

子项目信息填写页面如下图所示,并按照提示填写数据集详细信息,

另外子项目信息页面的质谱仪器信息(MS Instrument)、实验过程描述(Experiment protocol)和信息分析过程描述(Informatics protocol)三个部分都要填写且含有动态扩展选项(非必选),

第五步 · 上传数据文件

step five

iProX系统中数据文件在子项目下面上传。完成子项目信息页面填写后

1.完整提交需要包含的文件

a. 结果文件(result):mzIdentML(要有对应的PEAK文件,即spectra)、prideXML;

b. 质谱仪器产出的原始文件(MS instrument raw output)。

2.部分提交需要包含的文件

a. 搜库文件(SEARCH):即搜索引擎输出的结果文件 (search engine results, protein/peptide identifications);

b.质谱仪器产出的原始文件(MS instrument raw output)。

规则判断:

① 如果用户选择Complete submission,选择上传的文件中必须有RAW,和RESULT(PRIDE XML)或RESULT(mzIdentML)中的一种,并且如果是mzIdentML还要求有PEAK文件;

② 如果用户选择了Partial submission,选择上传的文件中必须有RAW和SEARCH文件;

③ 选择了Partial submission后,用户选择上传的文件中不需要PRIDE XML或mzIdentML格式的文件,如果有系统根据后缀判断的,或者用户手动选择这两类文件,会提示用户应该返回选择complete提交。

如下图所示,选择好提交数据的方式(Complete submission/Partial submission)和上传文件方式(Browse/Aspera)后,

完成上述操作后请

第六步 · 提交项目和子项目

step six

数据文件上传完成后,项目和子项目默认都是save状态,可以通过My Space-Project Tree,选定项目/子项目名并在右侧查看填写好的项目/子项目信息,

确认项目/子项目信息无误后,

第七步 · 下载数据和分享数据

step seven

登录用户通过My Space-Project Tree可以查看在iProX系统中有权限访问的所有数据,包括自己提交的数据(Project下方),加入群组内共享的数据,以及系统中所有公开发布的数据(

另外较常用的分享数据为在Project Tree下面选择项目,在

学会了吗?快来试试吧!

做蛋白组学· 找吉凯

吉凯基因凭借多年在靶标筛选及验证服务领域的技术积累,建立的标准化 、工程化 、系统化的GRP平台,为中国研究型医生提供科研服务,加快科研成果转化。其中,蛋白质组学平台拥有多台timsTOF Pro、Exploris 480高精度质谱仪,专业领先的Spectronaut Plusar、Mascot等分析软件,提供专业的4D、DIA、TMT、PRM、磷酸化修饰组等检测服务,强大的机器学习算法、IPA分析、蛋白基因组分析服务,系统的生物标志物、分子分型、药物靶点、基因功能研究等解决方案,真正让广大研究型医生的科研工作更省心、更省力、更高效。

1.实验技术干货

2.蛋白质组学研究

3.腺病毒简介及应用

4.临床基础研究思路解析    

5.组织特异性腺相关病毒

6.单细胞测序    

7.慢病毒实验操作指南

8.悬浮细胞专用病毒

9.靶点设计/数据库教程

10.测序技术研究与应用

11.非编码RNA研究技术与应用

12.腺相关病毒选择/应用    

13.表观遗传研究

14.文章解析

15.国自然课题设计思路解析

16.生物信息分析及工具      

17.外泌体研究    

18.肿瘤免疫研究

19.高分文章  

发布需求
作者
头像
仪器推荐
文章推荐