分析测试百科网

搜索

喜欢作者

微信支付微信支付
×

新篇章:单细胞基因组从头组装

2022.8.01
头像

超级艾蛋木啊

致力于为分析测试行业奉献终身

随着单碱基精度和读取长度的提高,利用批量样本的单分子长读测序技术已广泛应用于基因组组装。通常,长读测序组装需要大量的DNA(通常来自数百万个细胞的几微克),因此大多数人类基因组组装被限制在批量基因组测序数据集,而没有保持单个细胞之间潜在的遗传异质性。然而,这在许多情况下是不切实际的。相比之下,单细胞全基因组测序(scWGS)是揭示细胞间遗传异质性的有力工具,尤其是对癌症研究。基因组组装,或单倍型组装,可以更准确地使用克隆种群的基因更相似。单细胞NGS基因组测序技术是微生物基因组组装的常用技术。然而,基于NGS平台的单细胞基因组测序技术很少用于大型复杂基因组装配,即使使用批量NGS基因组测序数据,Contig N50的装配连续性也无法达到megabase水平,如仅使用批量Illumina测序数据和SOAPdenovo对人类基因组进行从头装配,得到的ContigN50为11.1kb;利用Illumina HiSeq X (PE150bp)平台对美国鼠兔从头基因组装配得到的ContigN50为∼42 kb;利用 Illumina和454对端文库得对美国野牛从头基因组装配得到的ContigN50为∼20 kb。


使用少量基因组DNA甚至单细胞基因组测序数据组装人类基因组更具挑战性。它不仅需要基于单细胞TGS平台的基因组测序技术的支持,还需要良好的数据分析策略和合适的组装器。7月12日,北京大学生命科学学院生物医学创业创新中心Tang Fuchou教授团队在《Nucleic Acids Research 》杂志上发表题为《单细胞水平的人类基因组从头组装》的文章,回顾了团队在第三代测序平台上可以对单细胞基因组进行测序的SMOOTH-seq技术的发展。SMOOTH-seq能够可靠有效地检测人类单个细胞中的SVs和ecDNAs,这使得单细胞基因组的长读取量(约6kb)测序成为可能,为仅从几个单个细胞组装人类基因组提供了先决条件。该团队在PacBio HiFi和Oxford Nanopore Technologies (ONT)平台上使用SMOOTH-seq对K562(人类慢性粒细胞白血病CML细胞系)和HG002(正常二倍体淋巴母细胞细胞系)进行了测序,并基于scWGS数据集,通过不同的组装程序和严格的评估证明了基因组组装的可行性。Tang教授领导的团队利用基于TGS平台的单细胞基因组测序数据,系统地探索了影响组装的因素。此外,为了研究基因组组装需要测序的单细胞数量的下限,我们改进了SMOOTH-seq技术。并在ONT平台上对30个基因组覆盖率相对较高的二倍体HG002细胞进行测序,发现从低至30个单个细胞(平均基因组覆盖率为41.7%)的基因组组装可以达到NG50约1.35 Mb。此外,通过分析K562细胞组装基因组的结构变异(SVs),该团队发现,与直接将单细胞基因组测序数据映射到参考基因组相比,可以识别更多的插入事件,并更有效和准确地说明复杂的结构变化。他们的研究提供了原则性证据,表明从几十个单个细胞的长读单细胞基因组测序数据中,用NG50 contigs的megabase水平组装人类基因组是可行的。


互联网
仪器推荐
文章推荐