该方案采用优化的拼接算法可对基因组数据进行精确全面的拼接,并通过一系列拼接效果评价指标衡量拼接的优化过程。基因组拼接的原理是根据测序读长read之间的重复片段(overlaps)识别前后位置关系。我们将采用优化拼接软件针对不同测序模式所获得的原始测序reads明确各自位置关系;对于测序难易覆盖的区域或者重复区域,可以在优化过程中提高拼接后的contig连通性;初步拼接成的contig片段或孤立的片段会继续循环被利用用于下一轮的优化拼接处理,保证数据的充分全面的被利用而不损失任何有效信息。草图绘制阶段形成的无法连通的scaffold可以通过设计适当的文库和针对个别区域进行gap的修补。
拼接结果评估和数据基本统计内容包括:
图例 de novo 基因组拼接原理
基因组从头测序(de novo sequencing)是不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究,为后续研究物种起源进化及特定环境适应性奠定基础。为该物种的后基因组学研究搭建一个高效的平台;为后续的基因挖掘、功能验证提供DNA序列信息。BioGenius利用新一代高通量测序技术(NGS),并可联同单分子测序平台(Bionano)高效地完成所有物种的基因组序列图谱。
详情请点击: http://www.biogenius.cn/htm/products/genomics/denovogenome/analysis/12.html
Big Data , Big Idea !
惠研生物,提供领先的生物大数据解决方案!
官方网站:www.biogenius.cn
咨询热线****** 180-1908-2932
官方微信: 微信公众平台搜索 “惠研生物”
官方QQ: 1744353207
咨询邮箱: service@biogenius.cn