Illumina测序数据研究
2024-09-16T15:16:40Z | 3 分钟阅读 | 更新于 2024-09-16T15:16:40Z

测序原理
sanger法测序及双脱氧链终止法,它采取DNA复制原理,通过在DNA复制过程中添加双脱氧三磷酸核苷酸(ddNTP)终止DNA链的延伸,在DNA链不同位置的延伸终止判断该位置的碱基类型。但是凝胶电泳的时间较长,导致sanger法测序通量低。illumina测序技术可以实现高通量,低成本,测序长度较短。
桥式PCR,主要用于扩大信号,4色荧光可逆终止反应,使illumina测序可以实现边合成边测序的技术。但Illumina测序技术不能像第1代测序技术一样测500bp以上,一方面测序时,经过长时间的PCR,会有不同步的情况。开始1个cluster中是100个完全一样的DNA链,但是经过1轮增加碱基,其中99个都加入了1个碱基,显示了红色,另外1个没有加入碱基,不显示颜色。这时候整体为红色,我们可以顺利得到结果。随后,在第2轮再加入碱基进行合成的时候,之前没有加入的加入了1个碱基显示红色,这个时候就会出现杂信号。当测序长度不断延长,这个杂信号会越来越多,最后很有可能出现50个红,50个绿色,这时信号不足以判断碱基类型,所以不支持长段测序。
Illumina测序技术细节
adapter
illumina测序过程中关键一步是将文库片段固定在flowcell上,然后通过桥式PCR将片段扩增,在被打断成300~500bp的长度的片段末端被补平后,adaptor将被添加到片段两端,用于将片段固定在flowcell上,同时adaptor中还包含桥式PCR所需要的引物。
桥式PCR
- 加上adaptor之后的DNA样品与flowcell上固定的oligo(寡链核苷酸)匹配后就被固定在flowcell上,通过桥式PCR进行扩增成cluster,便于后面的荧光测序。
- 第一轮扩增,将序列补成双链。加入NaOH强碱性溶液破坏DNA的双链,并洗脱。由于最开始的序列是使用化学键连接的,所以不会被洗。
- 加入缓冲溶液,这时候序列自由端的部分就会和旁边的oligo进行匹配。
- 进行一轮PCR,在PCR的过程中,序列是弯成桥状,所以叫桥式PCR,一轮桥式PCR可以使得序列扩增1倍;如此循环下去,就会得到一个具有完全相同序列的cluster。
- 一条lane能测得的数据量在30G左右,而一个样品的测序量一般不会这么大,所以在建库的时候对每一种样品的接头加上不同的标签序列,这个标签就叫做Index,有了index就可以同时在一个lane中测多种数据了,后期可以根据index将数据分开。
边合成边测序SBS
经过桥式PCR之后同一段序列已经成簇,下一段就是开始进行测序,这一步比较简单,就是加入primer,然后添加经过特殊处理的ATCG四种碱基,特殊的地方有两点:一个是碱基部分加入了荧光基团,可以激发出不同的颜色,另一个是脱氧核糖3号位加入了叠氮基团而不是常规的羟基,保证了每次只能够在序列上添加1个碱基。
这样每1轮测序,保证只有1个碱基加入的当前测序链。这时候测序仪会发出激发光,并扫描荧光。因为一个cluster中所有的序列是一样的,所以理论上,这时候cluster中发出的荧光应该颜色一致。随后加入试剂,将脱氧核糖3号位的—N2改变成—OH,然后切掉部分荧光基团,使其在下一轮反应中,不再发出荧光。
adapter1-Index-fragment-adapter2,adapter2通过与oligo互补连接在flowcell上,在进行完桥式PCR之后进行测序时,添加primer,这一段primer的序列是与Index互补的而非adapter1,所以最终拿到的测序结果应该是Index+fragment+adapter2