分析测试百科网

搜索

喜欢作者

微信支付微信支付
×

Nature | 云计算助力发现新型病毒

2022.1.27
头像

柔荑含莲

听君一席话,胜读十年书

病毒给人类的健康带来了巨大的威胁,比如1918年的西班牙流感、AIDS、埃博拉、SARS、新冠病毒等。据估计,能够造成人群传染病的病毒有3x105之多,然而可惜的是人们只认识其中的很少一部分。因此,在全球范围内对病毒进行监测是预测和预防未来病毒传播的最有效手段之一。


借助于新技术,比如高通量测序,人类已经发现了数千种新型病毒,并且这一发现的数量呈现指数型增长。然而,对这些测序序列的解读,比如对序列进行拼接,仍然是一项挑战。


2022年1月26日,加拿大的Artem BabaianNature 发表了文章Petabase-scale sequence alignment catalyses viral discovery开发了一种云计算平台—Serratus,可以实现PB(1PB=1024TB)级别的序列比对,并鉴定出了超过105个新型RNA病毒。


image.png


公共数据库比如SRA(Sequence Read Archive)上有PB级别的序列,并且这些数据信息都可以免费使用。研究人员将这些信息镜像上传至云平台Serratus(免费且开源,https://serratus.io)上,并利用Serratus对超过短序列数据集进行了分析(其花费低至平均每个数据集每天不到1美分)。这些数据集涵盖了近13年七大洲四大洋测过序的所有动物。


为了鉴定含有与病毒相关序列的文库,研究人员筛选了3,837,755个公共RNA-seq、meta-genome、meta-transcriptome和meta-virome数据集并与所有的冠状病毒以及脊椎动物病毒序列进行对比,之后与所有的RNA依赖RNA聚合酶(RNA-dependent RNA polymerase,RdRP)序列进行比对,鉴定出了已知的15,016个sOTU(species-like operational taxonomic units)和131,957个未知sOTU。据估计病毒的种类约为108-1012,因此这次计算得到的病毒数量也仅为预估的0.1%。


鉴于新冠病毒在这两年的流行情况,研究人员尝试利用Serratus在已有的数据集中挖掘冠状病毒,发现了70个sOTU,其中44个已经被报道,17个含有部分RdRP,9个为新型冠状病毒。


肝炎病毒每年导致的死亡比HIV、结核、疟疾等都多。其中丁型肝炎病毒是肝炎病毒的一种,并且在2018年之前被认为是δ病毒属的唯一一种。研究人员利用Serratus发现了14种δ病毒、39种ε病毒以及311种ζ病毒,扩展了人们对δ病毒属的认知。另外,通过对巨噬菌体进行研究,还发现孟加拉人身上的巨噬菌体与英国猫狗身上的巨噬菌体紧密相关。


总之,在新冠病毒流行的背景下,这一研究将这几年互联网的热点概念“云计算”应用在序列比对上,通过对公共数据库进行挖掘,发现了超过10万个新的RNA病毒,扩展了我们对于病毒世界的认识,有助于我们预测并预防未来的病毒大流行。


原文链接:

https://doi.org/10.1038/s41586-021-04332-2


互联网
仪器推荐
文章推荐