WX众号:基因学苑
Q群:32798724
更多精彩内容等你发掘!
前面一篇推文我们介绍了nanopore测序技术的一些显著优势,简单来说就是长读长、高产出、便携、实时、易用、直接。基于这些特点,在基因组或者转录组分析中可以有很多的应用,这次我们列举一些nanopore测序技术的一些典型应用。
大基因组拼接
nanopore最显著特点就是读长长。长读长对于大基因组的拼接将会产生立竿见影的效果。在以往基于短片段的基因组拼接中,由于一些动植物基因组本身具有多倍体,高度重复,高度杂合的特性,导致基因组拼接是一项异常艰难的工作,有些植物甚至复杂到利用短片段根本无法完成拼接工作,例如基因组大小高达152Gb的重楼百合 (Paris japonica),还有10倍体的择捉草莓 (Fragaria turupensis)等。虽然后来有了大片段文库,BAC文库,optical mapping光学图谱,Hi-C,bionano等辅助技术,但依然无法从根本上解决大型基因组拼接的问题。而nanopore测序技术将从根本上改变大型基因组拼接技术难题,根据百迈克公司公开发布的数据来看。利用三代测序可以极大的提高基因组的完整性contig数目减少,N50长度可以达到M级别,同时配合多轮纠错机制,拼接的准确性也非常高。
表1 百迈克公司发布部分物种nanopore数据拼接情况
细菌完成图
由于细菌基因组比较小,通常小于10M,大部分是一条染色体,并且由于细菌基因组通常重复序列不多,利用nanopore的长读长的特性,甚至可以一次性拼接出完整的基因组。笔者以前做过上千微生物基因组拼接,当时需要利用短片段多文库的策略拼接细菌完整图,折腾一个多月也无法彻底解决大的重序列的问题,而现在利用nannopor测序,只需几分钟(根据具体样品和硬件配置不同)就可以拼出一条完整的基因组(我们后面会有具体的推文)。
表2 百迈客细菌、真菌基因组(部分)组装结果统计
全长无偏倚转录组
以往的转录组分析,由于无法直接对RNA进行测序,往往需要先对mRNA进行打断,在反转录为cDNA。反转录过程中PCR可能会引入扩增偏差,导致筛选到假阳性的表达差异基因,尽管目前采用单细胞加UMI特异标签的方法减少PCR偏差。但依然无法获取和分析全长转录本,由于真核生物普遍存在的剪切差异,短读长测序依然无法准确识别,而利用nanopore的长读长测序,可以准确识别各基因的多个同源异构体,简单准确。并且nanopore可以对RNA直接测序,这样就能够直接识别RNA的碱基修饰。
大片段结构变异
目前的基因组突变分析主要在单碱基突变SNP,以及少量的插入缺失(InDel)上,而忽略掉基因组上含量巨大的大的结构变异。这主要是因为仅使用短测序读长时,无法准确检测这些变异,例如缺失、插入、重复、倒位和易位。但已有研究表明,这些重复区域和结构变异与人类的健康和疾病有关(例如,老龄化、三联体扩张疾病、自闭症、癫痫和癌症),使得对它们进行的常规表征鉴定非常有利。利用nanopore长读长的特点,非常适合进行大片段结构变异的检测。
突变定相分析
所谓定相分析,被称为Phasing,简单来说就是将一个二倍体(甚至是多倍体)基因组上的等位基因信息,判断出其遗传自父本还是母本,最终使得所有来自同一个亲本的信息都能够排列在同一条染色体里面。很显然,测序的长度越长对定相分析越有利(如果是完整一条就直接比对就行了)。根据文献报道,利用超长读长不仅使组装连续性提高了一倍(NG50~6.4MB),而且显著改善了定相(phasing)等位基因的功能。例如,有可能对包含在单个16 MB contig中的整个4 MB主要组织相容性复合体(MHC)进行定相(phasing)。
微生物快速鉴定
利用nanopore测序,实时,快速的特点,非常适合为微生物的快速鉴定。可以在采集点分析直接进行测序,而且实时的basecalling,上机几分钟之后就可以有序列产出,可以直接使用序列进行物种分类鉴定。从样本到检测结果用时大大减少。据报道,使用MinION在北极环境中从样本采集到测序数据生成仅需不到40小时。
---------- END ----------
(添加作者微信,请注明单位姓名)