wangprince2017

测序的世界

测序的世界

96 
刘小泽 
2018.06.19 17:52* 字数 9075 阅读 813评论 0

测序的世界很奇妙,不同的数据处理可能得出不同的结论,入门生信首先要做的就是了解你的数据
还等什么?跟我一起来探索吧~

测序原理:


早期如何测序呢?

如果给你这么一串珠子,让你统计绿色,白色,红色,其他这四种类型的数量,那你是不是要从某个位置一个一个数?没错,你已经开始对这串珠子进行了肉眼测序。

 
肉眼测序.png

其实对于DNA测序,思路也是这样。

早在1954年,Whitfeld等就提出了测定多聚核糖核苷酸链的降解法,该方法利用磷酸单酯酶的脱磷酸作用和高碘酸盐的氧化作用从链末端逐一分离寡核糖核苷酸并测定其种类。目的就是想通过这种一个一个“数”的方法来得到DNA的碱基顺序。

这里再补充一个小知识,DNA有多大?它的直径也就2nm,两个核苷酸之间的小沟0.34nm。肉眼观察肯定不行,那么显微镜呢?光学显微镜可见光的波长约为700nm,单单一个直径就看不到,更别说看更小的分子了DNA对于它来说根本不可见。要想用普通显微镜观察不可能,更强大的电子显微镜呢?别忘了,DNA分子并不是平躺着让你去观察,他有四级结构,不断扭曲、折叠,简单的二维图片是很难区分开来的,能看到也仅仅只能看到一小部分。就像上面的这张珠子图,拍一张照片,就能准确区分被压着的珠子和它上面的珠子顺序吗?不能够!

人类基因组共有31.6亿个DNA碱基对,23对染色体,测一条染色体就需要测1-2亿个碱基对,像这种数数的办法肯定行不通,太耗费人力。那么有没有什么办法可以实现半自动化呢?

视觉不行,另辟蹊径,听过“盲人摸象”的故事吧,70年代的Sanger发明了“双脱氧终止反应法”,他就是利用了双脱氧核苷酸 ddNTP去摸索DNA分子。例如,一条序列5‘ --> 3\' 实际为TGACTTCG但我们之前不知道,这样操作:

操作过程可能会有些无聊,但是不难懂,希望你能理解其中的意思,因为后来测序都是受此启发,这是鼻祖

  • 设置四个反应体系1-4,分别加入引物、DNA聚合酶、四种dNTP、一定比例的ddNTP(带有放射性标记)例如1中是ddATP,它就负责测定T碱基的位置;依次2是ddCTP,3是ddTTP, 4是ddGTP

  • 假如扩增过程中ddATP遇到了T位点,就结合并终止(因为ddNTP的2‘和3\'都没有羟基),那么其他的dNTP就无法结合。也许你会问,那么每次如果是这四种ddNTP占了先机先结合了,其他的都无法再结合,结果不就是一种可能,只能确定四个位点?并不是这样: 大批量的核苷酸结合本就是一个随机问题,不一定每次都是ddNTP结合,有可能是dNTP结合了好几个然后ddNTP才回过神,结合完再宣告一个聚合过程结束。

    想象ddNTP是VIP会员,dNTP为普通用户,只要ddNTP不结合(不占用绿色通道),普通的dNTP就有机会。

  • 因此,在这反反复复的结合过程中,就会把所有的位点都结合(因为测序测的不是几百几千条序列,而是几千万条序列),这其中有的是dNTP结合,有的是ddNTP结合,但是,在一个大规模样本中,ddNTP会结合所有位点,只是位点结合次数多少的问题,可能这一个位点有五千条序列测到这列就停了,但是下一个位点又有其他的8千条序列测到。 说的简单一点就是,一段时间内大量的ddNTP会结合完所有测序位点。

  • Q: 最后怎么看结果?这里很有意思,一个位点可能会被大量的dNTP和ddNTP结合,怎么去除dNTP的干扰

A: 其实也不用刻意去除,最后利用凝胶电泳和放射自显影只能看到带有荧光标记的ddNTP,他们的排列顺序先利用电泳条带前后关系确定下,再用A-T, T-A, C-G, G-C关系反转一下,就能知道我们的测序序列

  • 附上一张图,帮助理解
     
    Sanger测序.JPEG

    有了早期的第一次测序成功,才有了后来1983年的Kary Mullis 发明PCR测序仪,利用PCR才有了我们更加效率的NGS(二代测序)。进步的是方法,不变的是基本理念。

当然,千万别小瞧了一代测序(Sanger测序),到今天这种方法还是经常使用。他之所以不是现在的主流,不是因为它测不准(恰恰相反,第一代测序技术的主要特点就是测序读长可达1000bp,准确性高达99.999%,二三代所不能及),而是因为它的通量低,成本高。
要知道,目前二代测序的错误率还在
目前一代测序在验证序列(就是平时送公司测序返回来自己blast的那些)以及验证基因组组装完整性方面都是金标准。


二代测序:

一代测序的原理我们搞清楚了,没有PCR,利用聚合酶延伸链。这就有一个问题,酶的活性会下降,所以一代最长能测1000bp,再多了就要重头开始一遍导致成本高;另外它一次只测一条,也就是所谓的通量低。但是呢,他的确有值得借鉴的地方,就是准确度很高,99.999%。人类基因组计划HGP,1990年-2003年完成,利用的就是改进的Sanger测序法

后来技术不断改进,Roche公司的454技术、illumina公司的Solexa/Hiseq技术和ABI公司的SOLID技术标志第二代测序技术诞生。其中Roche公司的454测序系统是第二代测序技术中第一个商业化运营的测序平台。

其中Illumina市场规模占到75%以上,主打Hiseq,下面

分类:

技术点:

相关文章: