分析测试百科网

搜索

喜欢作者

微信支付微信支付
×

测序简史(一)

2021.7.01
头像

王辉

致力于为分析测试行业奉献终身

这几天天气很热,热的人心惶惶。因此一直提上日程的所谓的测序简史,也没有时间去好好的落实。中途找过一个行业内的颇有影响力的人,但是他由于种种原因,也没有能踏踏实实的去做这件事情。几经周折,这个任务还是落到了我自己的肩上。


于是乎,我鼓鼓勇气,尝试着去把这段从1977年到2017年的漫长而又渺小的四十年说的有趣些儿。

当我起笔去写这篇文章的时候,小伙伴们还在工作室因为某个服务器后台技术争论不了,这样看来生信人团队还是非常有希望的。另外,关于测序简史这一块,我一直不知道怎么去娓娓道来,不知道如何才能说得清楚,还不让大家反感,我只能硬着头皮利用自己知道的皮毛知识给大家编织一个我所认为的测序简史,博君一笑。

由于这篇文章内容过长,我觉得还是轻松点,大家才能阅读下去,毕竟很少有人能够逼着自己去做一些事情,一点一点的诱惑,不仅有用,而且高效,为啥不用呢,废话到此结束,言归正传。

啥叫测序?这个官方有官方的解释,大家可以自行百度,我觉得通俗意义上跟测序身高体重三围没啥区别,区别在于测序难度大并且包含的信息量大。

身高仪测量你的身高信息,体重称量你的体重信息,三围表征你的性感,不是健康信息。测序是测量你的遗传信息。

遗传信息,大家应该都清楚,如果不清楚的话麻烦各位翻一翻高中的肺炎双球菌实验,讲的就是啥是遗传信息,如何发现遗传信息的。

放张图,方便大家回忆。


attachments-2017-07-66DKGwVC5977122dc1074.png

原来的科学家们通过老鼠死没死,最终得到的结论是DNA是主要的遗传物质,部分物种的遗传物质是RNA。

在弄清楚这个事情之后,大家也都知道沃森和克里克还有一些被遗忘的科学家一起努力弄清楚了DNA是双螺旋结构。并且(A-T,G-C)。


                                                                                                                    第一代测序技术

一、简介

第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法或者是1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解). 并在1977年,桑格测定了第一个基因组序列,是噬菌体X174的,全长5375个碱基。自此,人类获得了窥探生命遗传差异本质的能力,并以此为开端步入基因组学时代。研究人员在Sanger法的多年实践之中不断对其进行改进,在2001年,完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础。

一代测序技术的原理见下图。再模板中首先分别加入A、T、G、C和四种ddNTP双脱氧核苷酸(加入ddNTP序列合成会终止),如下图第一个加入ddATP,这样每一个位置上的A位置会大量的被ddATP替代,然后终止,然后再分别加入其他的ddNTP,让他随机终止。这样对得到的这些序列进行跑胶。就得到了如下的胶图。根据ACGT的加入顺序和位置,获取信息。这个方法准确率高,费用高,是先合成,再测序的。

attachments-2017-07-fthR6P6Y597712430a639.png

桑格先生13年与世长辞,但是一代测序技术在他发明之后经过各个单位的改进,今天还被大量使用。

NCBI的悼文:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3903207/

Of the three main activities involved in scientific research, thinking, talking, and doing, I much prefer the last and am probably best at it. I am all right at the thinking, but not much good at the talking.

—Frederick Sanger, 1988


二、一代测序主要应用方向

大伙肯定好奇啥是黄金测序,标题很抢眼,但的的确确存在测序的黄金标准:一代测序了,小编故称之为黄金测序。

   今天给你们带来一些低门槛纯经验的黄金测序(哈哈就是一代测序了)中你应该知道的point:高通量测序最近这几年很火越来越火,但是世界上更多的还是一帮天天做分子克隆、养细胞、养细菌、杂蛋白的生物学家,究其原因Sanger测序还是测序届的金标准,由于精确度高于2、3代测序且保持大白菜价格使之地位稳固。应用范围:De Novo测序、重测序: 如突变检测、SNPs、插入、缺失克隆产物验证、比较基因组、分型: 如微生物和真菌鉴定、HLA分型、病毒分型

、其它: 如甲基化分析(重亚硫酸盐测序)和SAGE(基因表达串联分析)方法

、临床应用:肿瘤突变基因的检测和肿瘤个体化治疗。


三、一代测序注意问题


1.测序结果不到800Bases是什么原因?

(1)G/C rich、G/C Cluster。

这种情况一般表现为测序信号突然减弱或消失(图1,图2)

如在DNA样品中的DNA序列分布匀称,没有复杂结构时,正常的测序反应能保证达到800Bases以上。但有一些DNA样品立体结构复杂,造成聚合酶延伸反应终止,测序信号突然减弱或消失,或者测序结果出现套峰现象,出现这些现象的原因由DNA模板本身所造成。

attachments-2017-07-KMTP74JV5977126a5e4c0.jpg

图1 GC引起的信号减弱

attachments-2017-07-wsw8qdIC5977128374b3e.jpg
图2 G/C rich引起的信号消失

(2)A、T的Poly结构

   这种情况一般表现为A、T连续结构后面的测序结果出现套峰。根据文献记载。原因在于聚合酶进行聚合反应时,由于A或T的连续,聚合酶难以识别完整的每个A或T,在某个A或T的后面便开始进行A或T连续结构以后序列的聚合反应(打滑现象),造成测序结果紊乱,出现套峰。一般在多少个A或T的后面能出现这种情况呢?现在还没有这方面的报道。根据我们的经验,这一情况的出现和A或T的连续结构后面的序列的排列情况有着直接的关系。有时10多个A或T的连续结构后面便出现套峰,但有时60~70个A或T的连续结构后面的序列也一样可以完整地读出来。具体情况还有待考证。一般来说,PCR片段直接测序时,A或T的连续结构后面的序列测序结果都会出现套峰。原因在于测序时经历了PCR反应及测序反应(测序反应本身也是PCR反应)二次聚合酶的打滑现象。

attachments-2017-07-PPivKEuE59771294ae2ea.jpg

图3 polyA引起的套峰


互联网
文章推荐