分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

微生物多样性“全新”升级——“ASV”质的飞跃

中科新生命蛋白代谢多组学
2023.5.19
4779ad427b859161348cf2fdc75a511c.png

近年来,微生物群落的组成和多样性研究逐渐成为农业及医学科研热点,越来越多的研究开始致力将微生物多样性作为基础研究。因此,微生物多样性的数据分析也被越来越多的研究者所关注和学习。为助力广大微生物领域的科研工作者,中科新生命《微生物多样性v2.0》全新起航,接下来,让我们一睹新流程的独特风采吧。

8999d618f976d0d4adcb70d6b8260f45.jpg



QIIME2替代QIIME1

特征提取更新换代

01

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

“ASV”对“OTU”的替代。OTU是以序列之间的相似度为阈值(一般选择97%)划分为操作分类单元。一段时间内被认为是扩增子测序聚类方法的“金标准”。

DADA2于2016年发表在Nature methods,发表之初即为通过降噪得到不含扩增与测序错误,不含嵌合体的生物学序列,其聚类相当于100%相似度进行聚类。

02

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

QIIME2的可重复分析且可扩展插件的理念成为扩增子分析首选平台。

03

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

基于机器学习的物种注释方法。QIIME2中使用Naive Bayes分类的classify-sklearn算法,可以最大程度上确保注释结果的可靠、准确。在分类器的运行性能方面,随着目标序列数的增加,注释分析的运算时间优于Vsearch、BLAST等方法;且当参考序列数据库增大时,注释分析的运算时间又优于RDP、SortMeRnA等方法。

16831ad1a7c9f37e8237a95955ef8d92.png



Database升级

提高样本的物种注释率

01

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

16S/18S数据库:silva138(https://www.arb-silva.de/)。silva数据主要来源于EMBL-EBI/ENA,命名源自于EMBL的公布编号(release number)。silva每年根据EMBL数据库的更新频率进行更新。silva数据库收录全面、更新比较及时,是目前高通量测序常用的16S分析参考数据库之一。

02

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

ITS数据库:UNITE(https://unite.ut.ee)。Unite是目前真菌ITS整理最全面的数据库。它的目标是形成正式的真菌条形码-核糖体内部转录间隔区(ITS)区域-并提供所有~1,000,000公共真菌ITS参考序列。



PICRUSt2进行功能注释

16s/18s功能预测新利器

PICRUSt2(Phylogenetic Investigation of Communities by Reconstruction of Unobserved States)是基于群落标记基因序列丰度预测菌群功能丰度的软件,诸如KEGG同源基因,COG同源蛋白簇。相对PICRUSt1,PICRUSt2进行了以下提升:

01

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

参考基因组数据库比初代扩大了近10倍,使功能预测信息更加全面,较大提高了预测精度。

642b43d57a4f1cda3025c8f455805d46.jpeg

数据库规模

02

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

贴近实际环境的预测设置。

PICRUSt2通过将OTU/ASV序列输入至16S参考序列进化树中进行基因家族拷贝数预测,而参考序列进化树可根据不同样本类型(如肠道微生物、土壤微生物等)自定义特定环境的参考数据库。

03

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

使用Castor隐藏状态预测算法,同时使用MinPath推断代谢通路,使得预测更严谨。

PICRUSt2功能预测模块,包括MetaCyc(https://metacyc.org/)、KEGG(https://www.kegg.jp/)、COG (https://www.ncbi.nlm.nih.gov/COG/)、Pfam(http://pfam.xfam.org/)和TIGRFAM (http://tigrfams.jcvi.org/cgi-bin/index.cgi)。

13904aa6a1cc6657f2b7456e16a282cd.jpeg

PICRUSt2算法逻辑图



FUNGuild

真菌ITS到功能分类“神器”

我们使用FUNGuild数据库,完成真菌ITS从特征序列到功能注释的跨越。其涵盖了超过12000个真菌的功能注释信息。根据营养方式分为三类:

01

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

病理营养型(pathotroph)—— 通过损害宿主细胞而获取营养(包括吞噬型真菌phagotrophs);

02

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

共生影响型(symbiotroph)——通过与宿主细胞交换资源来获取营养;

03

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

腐生营养型(saprotroph)——通过降解死亡的宿主细胞来获取营养。

192be075ceb22471b425109301734e25.png

FUNGuild预测结果



多种距离算法“加持”

差异分析更加丰富

01

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

同步使用Weighted Unifrac/Unweighted Unifrac/Bray Curtis三种距离矩阵做Beta多样性分析和可视化统计分析

1a43827a4072d69febe3fcd8a3e5e55b.png
ac80220a7c3692943cd478b4fb77706d.png
58f3791da711e383749e0af05ae8a43d.png

基于三种距离算法的差异分析

02

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

STAMP分析不同组间“各层级”菌群丰度差异(2组及多组)

84c94950f1ed24249dff28ba39efc7c2.png
593c351dc49ae14254a8c411c34e1bf1.png

STAMP分析结果

03

68c751fcf4f824a1cd2f2f5f7ab9a80c.jpeg

LEfSe 基于LDA算法计算不同组间菌群丰度差异——不同维度丰度差异

5ed269f1bb770cc9e4fd0e4d01843210.png
b95e21e31f5527eabab58aa6380c5104.png
7828b76944f1a93e0f5b8b412302923f.png

LEfSe分析结果



8999d618f976d0d4adcb70d6b8260f45.jpg

中科新生命《微生物多样性v2.0》,全流程QIIME2分析,内容包括 ASVs分析及物种注释、α-多样性、β-多样性、物种差异与标志物种分析、组间群落结构差异显著性检验、环境因子关联分析以及功能预测等,技术路线如下:

3d254e8e512a1bae3317ed832cace294.png
8999d618f976d0d4adcb70d6b8260f45.jpg



0085a728ef36db473ce0d6ca549ffd26.gif

中科优品推荐

【中科新生命】建立了完整的多组学服务平台,通过多组学生物信息学报告的剖析和引导,能够帮助老师们从庞大而又复杂的多组学数据中迅速理出线索,充分利用好组学大数据带来的系统生物学信息。联合分析限时免费体验中,诚邀您来体验。

62a80ebcb044f804875b019cbae681c0.jpeg


ed1364c86765a79ec91a0c7da8048ad7.gif

更多合集推荐

蛋白业务线:

4D系列 | DIA系列 | 临床大队列系列 | 非靶向蛋白质组外泌体多组学系列 | 靶向蛋白质组 | 单细胞蛋白组 | 磷酸化修饰组 | 泛素化修饰组 | 酰化修饰组 | 糖基化修饰组 | 修饰蛋白质组 | 蛋白+修饰多组学 | 蛋白/修饰+代谢多组学 | 深度血液4D-DIA蛋白组 | Olink蛋白质组学 极微量蛋白质组学

代谢业务线:

医学代谢组 | 植物代谢组 | 非靶向代谢组学 | 靶向代谢组学 | 高通量靶向代谢组学 | 代谢流 | 空间代谢组学 | 代谢多组学 | 脂质组 | 非靶代谢plus | HA2000 | 非靶脂质组学绝对定量plus

高通量测序业务线:

肠道微生物系统解决方案 | 单细胞测序专题 | 转录调控专题

研究领域:

标志物研究 | 宿主微生物研究 | 单细胞研究 | 蛋白基因组与分子分型研究 | 肿瘤 | 神经精神 | 妇幼 | 代谢疾病 | 植物 | 动科 | 中医药 | 食品


3eb7d472baa53479ce48b786177a39b5.gif
2b7433382ee1d6a51a0dad3e69990127.gif

我知道你

在看

9a5114fff6eaabbd54101db06bff3da8.gif

发布需求
作者
头像
仪器推荐
文章推荐