导语
转录组原始数据的上传是进行转录组+代谢组文章投稿过程中的必不可少的一步。转录组数据最常见的上传数据库是NCBI的SRA数据库。下面是一篇纯干货,教大家如果上传转录组数据至SRA数据库。
SRA 数据上传包括几个平台,即:Bioproject,Experiment,Biosample,run。
每个平台具体的含义是:
Bioproject—SRA study: 研究目的-为什么要对样品进行测序;
Biosample—SRA sample:用于测序的样品的具体描述性信息。
SRA Experiment:具体测序是如何进行的,包括测序类型,机器型号,测序策略等信息。
SRA run:数据上传。
例如一次测序中包括 5 个样本,则上传时包括 1 个 Experiment,1 个 Project,5 个 Biosample,5 个 run。所以上传数据包括几个内容的创建,而 Biosample 和 Bioproject 的创建是可以独立出来的。
一、账号注册
网址:https://www.ncbi.nlm.nih.gov/account/
*按照提示注册,需要去注册邮箱完成验证,再登录
二、Bioproject 的创建
1.
2.
3.
4.
5.进入以下页面,需要填写两个信息。
1)测序数据类型,以转录组为例;
2)单一物种还是多物种,以多物种为例,填写完成后
6.进入以下页面,需要填写物种信息,填写完成后,
7.进入以下页面,需要填写三部分内容。
1)数据即刻公开还是选择在特定时间公开。两个可以随机选择;
2)Project title,这个系统自动匹配;
3) Public description,公共描述,对上传的数据研究目的做一简单描述。
填写完成之后,
8.这里需要填写样本信息,需要重新新建一个BioSample,此页面暂时保留。
三、新建BioSample
1.
2.进入以下页面,
3.进入以下页面,之前建BioProject的时候填过了,这里会自动补充。可以
4.进入以下页面。填写数据公开或者保密时间,可以选择与BioProject相同,即刻公开或者延迟几个月,填写完成后,
5.进入以下页面,选择样本类型,植物还是动物、人,这里以植物为例,
6.进入以下页面,需要填写样本信息,
7.开始填写表格,绿颜色为必填,黄颜色为选填,蓝颜色为至少填写一个。
保证后面的描述是每个样本具有特异性,否则会一直上传失败。
8.将填好的样本信息表上传至下面红框里,
9.到达这步后,
10.返回到刚开始的BioProject页面
填写Sample样本信息,将BioSample里的NCBI赋予每个样本的编号输入进去。
11.在这个页面下,可以直接
12.进入如下页面,可直接
13.进入如下页面,等待片刻,即可上传完成。
上传成功后,红框处会有一个NCBI提供的BioProject的编号,记住编号,后面会用。
四、上传SRA数据
1.
进入网站后,
2.进入如下页面后,
3.进入如下页面,
4.填写一些基本信息,这些之前已经填过了,所以这里系统会默认填充。
5.进入如下页面,需要填写三个内容。
1)是否建了一个BioProject项目,
2)是否建了一个BioSample项目,
3)数据是否公开,可跟前面保持一致。
填写完成后,
6.进入如下页面后,
7.填写下载的表格。
第一列是之前BioSample给的每个样本的编号,第二列是文库ID,变黄的可以在下拉里选择。
8.填写完表格后,
9.进入以下页面,选择FTP上传,下载filezilla软件,按照第二个红框里给定内容,填写地址,账号,密码,输入文件夹信息,见第二张图,标红框处必填,否则无法登陆。
登录成功后,将测序原始数据拖到右面空白处,进行上传。可在下面框框里查看上传进展,等待数据完全上传成功。
10.数据上传成功后,返回刚刚的网页界面。
以上就SRA数据上传的所有教程了
有需要的小伙伴们可以收藏备用哦。
99%的代谢组学研究者都在阅读下文:
●项目文章 | 菌群研究揭示中药治疗肠炎机制
●转录组+代谢组专题 | 常见实验验证策略
●项目文章 | FRONT ENDOCRINOL 代谢组揭示反复自然流产的发生机制
●项目文章 | IF=11.492!首个基于中国汉族人群的冠心病mGWAS研究
客服微信:18062045271
咨询电话:027-62433042
邮箱:support@metware.cn
网址:www.metware.cn
我就知道你“在看”