分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

微生物专题 | 如何快速打开不讲“人话”的16S测序分析报告?

迈维代谢
2022.3.23

9c137e290616695e4aaf64bcfa9867c8.jpeg


盼呀盼呀……16S检测结果终于分析完成了,可拿着一堆数据和结果文件,该如何判断结果的好与坏呢?从结题报告的什么地方可以找到答案?

bb89ac20ea8a587405c064ec1ce8db35.gif


Action你问我答现在开始。


第1问  数据量够不够?

测序数据量是否满足合同要求应该是大家第一个关心的问题,咱们可以在测序数据预处理部分,数据预处理统计及质控表中可以找到答案。


c935cd5eabda10c8575cc80ddb5d9d23.png


通过表格第二列RawTags可查看该项目每个样本的数据量是否都大于合同中签订的5万tags或者10万tags。也可以根据倒数第二列查看测序数据质量,Q30是否大于85%。其他各列的注释如下

Raw Tags:双端 reads 拼接得到的 Tags 序列

Clean Tags:Raw Tags 过滤低质量和短长度后的序列

Effective Tags:过滤嵌合体后,最终用于后续分析的 Tags 序列

Effective Ratio (%):Effective Tags 占 Raw Tags 的比率

Effective Bases (nt):Effective Tags 的碱基数目

Effective Base:最终 Effective 序列中的碱基数目

Min Length:Effective Tags 中最短的长度

Max Length:Effective Tags 中最长的长度

Mean Length:Effective Tags 的平均长度

Q20 (%) 和 Q30 (%):Effective Tags 中碱基质量值大于 20(测序错误率小于 1%)和 30(测序错误率小于 0.1%)的碱基所占的百分比

GC (%) :表示 Effective Tags 中 GC 碱基的含量



第2问  测序策略是否合理?

每一种样本类型都有它的特殊性,对应的测序策略也各不相同,经常有人问到“别人的项目选择5Wtags数据就可以,为啥我的不行?”


测序数据量的选择是否合理,通过下面这个图就可以找到答案。


799025ba05ee292931870569becd0434.png

 

 图1  各样本稀释曲线


稀释曲线中,横坐标为从某个样本中随机抽取的测序条数,纵坐标为基于该测序条数能构建的OTU数量,用来反映测序深度情况,不同的样本使用不同颜色的曲线表示,随着测序数量的增加曲线趋于平缓,说明数据量充足。


第3问  样本数量够不够?

物种累积箱形图可以作为对样本量是否充分的判断箱形图位置急剧上升表明样本量不足,需要增加抽样量;反之,则表明抽样充分,可以进行数据分析。

1fa58073348ae9b21b44e5d25cd66763.png

 

 图2  物种累积箱形图


横坐标为样本量;纵坐标为抽样后OTU数目。结果反映了持续抽样下新OTU(新物种)出现的速率。在一定范围内,随着样本量的加大,若箱形图位置表现为急剧上升则表示群落中有大量物种被发现;当箱形图位置趋于平缓,则表示此环境中的物种并不会随样本量的增加而显著增多。


第4问  生物学重复好不好?

生物学重复好与坏,可通过多种分析结果体现,最常用的就是降维分析,包括PCoAPCANMDS分析。图中,横坐标表示一个主成分,纵坐标表示另一个主成分,百分比表示主成分对样本差异的贡献值;图中的每个点表示一个样本,同一个组的样本使用同一种颜色表示,根据点与点之间的距离判断样本与样本之间的相似性,距离越近相似性越高,越容易聚在一起。同一种颜色的样本(同一组),距离越近,生物学重复越好。


ee7b3db66fe341db6cadcab5bfe71ab3.png

 

 图3 基于WeightedUnifrac 距离PCoA 分析



f8ed1a718c32b8c43a62b55ec2541953.png

 

 图4 PCA分析



416f64adef775d469af5e2fb98afdc5b.png

 

 图5 NMDS分析

三种分析的计算方式各不相同,可根据实际情况选择其中一种用于文章展示,PCoA是基于Weighted Unifrac 距离和Unweighted Unifrac 距离进行分析,PCA是基于欧式距离进行分析,NMDS是基于Bray-Curtis 距离进行分析的非线性模型,其设计目的是为了克服线性模型(包括PCAPCoA)的缺点,更好地反映生态学数据的非线性结构,所以NMDS是一种更适用于生态学研究的排序方法。



第5问  可以鉴定到多少种菌群,菌群丰富度和多样性好不好?

每个样本大致能鉴定到多少种菌群(OUT),可以通过《Alpha多样性统计表》找到答案,表格第二列Observed_otus就是直观展示样本中OUT的数目,即鉴定到菌群的数目。


d863ffa5af8656c25e1eb43bf9c78d29.png


其它各列指数都是用于分析样本内的微生物群落的丰富度和多样性,数值越大表明群落丰富度和多样性越高,各项指数的含义如下所示

Observed_species:直观观测到的物种数目(也即是 OTU 数目)

Shannon:样品中的分类总数及其占比。群落多样性越高,物种分布越均匀,Shannon 指数越大

Simpson:表征群落内物种分布的多样性和均匀度

Chao1:估计群落样品中包含的物种总数

ACE:估计群落中 OTU 数目

Goods_coverage:测序深度指数

PD_whole_tree:群落内物种的亲缘关系

simpson 有3种展示形式,即 Simpson’s Index(D),Simpson’s Index of Diversity(1 - D)和 Simpson’s Reciprocal Index(1 / D),它们对于反映群落多样性的效果相近但是计算的结果形式不同;本分析使用 Simpson’s Index of Diversity(1 - D)


其次,各样本微生物群落的丰富度和多样性也可以通过RankAbundance图体现:


434f23a9184d2cd654c7c0bf842bcb75.png

 

 图5 各样本Rank Abundance 曲线


Rank Abundance曲线中,横坐标为按OTUs丰度排序的序号,纵坐标为对应的OTUs的相对丰度,每个样本曲线的延伸终点的横坐标位置为该样本的物种数量,不同的样本使用不同的颜色的折线表示。如果曲线平滑下降表明样本的物种多样性高,如果曲线断崖式下降表明样本中的优势菌群所占比例很高,多样性较低。

d6f7d1de7670c0616fb9097c8be999b8.gif

春游题海

通过以上5点分析内容,你是否已经快速了解16S测序数据好坏呢?如果您有任何疑问欢迎在文末留言哦。

089d6f2cc5d8fced73cdc4eebd91a0e7.png



a82c4646d681f4ec092b1b353e7bb14a.jpeg


996a75f323f9b291e084199f8a4c24aa.gif

咨询电话:027-62433042

咨询微信:metware888

邮箱:support@metware.cn

网址:www.metware.cn

我就知道你“在看”

248cd138ef1f8b06443d5d745bbb25e9.gif
发布需求
作者
头像
仪器推荐
文章推荐