分子生物学高端技术科研服务专业平台获得Affymetrix、Agilent两大平台服务资质认证

首页 技术&解读&应用

全外显子捕获测序哪一个方案最佳——这里有你要的

2016-11-28 13:01:46 

背景

随着测序技术的快速发展,使利用全基因组测序(WGS)和外显子组测序(exome-seq)分析个体基因组成为可能,并且这些技术在基础科研和转化研究中的应用越来越广泛。外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕获并富集后进行高通量测序的基因组分析方法。虽然WGS更全面综合,但是外显子捕获测序技术由于其特有的优势在变的越来越普遍。与全基因组重测序相比,因为外显子组测序只针对外显子区域的DNA即可,覆盖度更深、数据准确性更高,更加简便、经济、高效,因此适用于大量样本的分析。这个技术可用于寻找复杂疾病(如:癌症、糖尿病、肥胖症等)的致病基因和易感基因等的研究。同时,基于大量的公共数据库提供的外显子数据,我们能够结合现有资源更好地解释我们的研究结果。

目前主要的三个捕获平台分别是安捷伦(Agilent)的SureSelectHuman All Exon 50Mb,罗氏(Roche/Nimblegen)SeqCapEZ Exome Library v2.0和Illumina的TruSeqExome Enrichment。三个平台都是以生物素标记的寡聚核苷酸为探针,与片段化后的基因组DNA文库杂交,通过碱基互补配对与外显子区域结合,再用链霉亲和素磁珠纯化将目标区域拉下来进行富集,之后测序。这三个平台的区别是选择目标有差异,探针的长度,探针密集程度和分子不同(Nimblegenand Illumina用的是DNA, 而Agilent用的是RNA),这里我们系统的向大家分析展示了每一个平台各自的特点,来告诉科研工作者测序结果的差异是由哪些设计上的不同和试验参数上的不同造成的。

结果

这三个平台在寡聚核苷酸探针密度设计上有很大差异(图a)Nimblegen设计了很多有重叠的探针序列可以将目标序列覆盖很多次,这使得它成为三个平台中探针密度最高的平台。Agilent 探针是一个接一个的跨过目标外显子,Illumina是依靠paired-end reads延伸探针以外的序列填补上空白序列。

图a:探针设计详情示意图

外显子组捕获平台的目标序列也有所不同,外显子组包括基因组中所有可以转录为成熟RNA的外显子。存在很多mRNA数据库(包括RefSeq, UCSC KnownGenes 和 Ensembl)但是,这些数据库同样包含了很多不同的非编码RNA序列,并且一些转录本的起始和结束位点在不同数据库中也不尽相同。不同的捕获平台基于自己可用的数据库不同都有自己特有的目标外显子组。我们比较了三个平台外显子组覆盖基因组的确切区域(图b)。三个平台可以捕获的目的区域相同的占很大一部分(29.45 Mb),其中Nimblegen 和Agilent可以捕获的目的区域相似的高达(38,830,789 bp)比 Nimblegen和Illumina 相似的30,304,987 bp 与Agilent和Illumina相似的33,299,208 bp 都要多,并且每一个平台也都包含有自己所特有的目标区域4.4–28 Mb

检测它们在主要RNA数据库(RefSeq (coding and untranslated region(UTR),Ensembl (total and coding sequence (CDS)) and the microRNA (miRNA)database miRBase19)中的覆盖范围(表1),在RefSeq (Fig. c) 和 Ensembl (Fig. d)数据库中三个平台在编码外显子的mRNA覆盖上极为相似占29.45 Mb,尽管如此,每一个平台也有自己的特异目标区域。Illumina 特异目标区域在RefSeq UTR 数据库中占27.73 Mb(Fig. e) 。. Nimblegen 的特异区域在miRNAs数据库中居多, Agilent 则是 Ensembl genes。

表1:各个平台在不同数据库上的数据覆盖

图c:维恩图解三个平台在RefSeq coding exons重叠的目标区域。图d:维恩图解三个平台在Ensembl CDS exons重叠的目标区域。图e:维恩图解三个平台在RefSeq UTR exons重叠的目标区域。

比较三个不同平台在方法上的差异(表2),DNA起始量从1-3μg,测序前的建库时间从3.5d(Agilent, Illumina) 到 7 d (Nimblegen).不等,杂交前后的PCR循环数依据平台的不同而不同,Agilent 用的是RNA而不是 DNA做探针,且所有的平台都可以自动化完成,尽管每个平台试剂盒的参考价格各不相同,但是还是有和供应商协商的余地,每个反应的价格在400美元到1000美元范围内。

总结

在比较各个平台的优缺点后,各个研究机构可以依据我们研究结果去选择哪一个平台最适合自己的研究。三个外显子捕获平台都显示了很高的捕获效率,同时捕获的目标序列也能覆盖大部分的外显子区域。具体哪一个富集平台最好,这要依据研究需求而定,NimblegenSeqCap EZ Exome由于高密度重叠的诱饵,相比于其他两个平台,它可以以最小的测序数据量获得最大的覆盖比例。所以,当覆盖研究区域有限制时,Nimblegen要优于其他两个平台。

然而,很多研究者更倾向于更大的基因组覆盖,随着单碱基的测序价格的下降,测序效率和覆盖率上的最佳平衡正在改变。随着测序越来越便宜,效率变得不像覆盖率那么有价值。为此,我们又探究了每一个平台在基因组上特异的覆盖区域,这会对那些有特殊研究需要的学者有帮助。尽管 Illumina 平台比其他两个平台捕获的效率低,但是它是唯一一个设计有富集UTRs区域的,这一点其他两个平台完全没有涉及。对于有这方面需求的研究者来说,Illumina将会是最佳的选择。

大部分做外显子组测序的都是对编码区域感兴趣,但是,编码区域很难被确定,不同数据库对这个的界定都不太一样。外显子测序的主要目的是发现一些表型差异的突变,外显子组测序对遗传病的研究有特别大的帮助,这些病很多都是由编码区域微小的碱基突变所引起的。我们的研究结果表明在RefSeq exome数据库中,Nimblegen 在检测SNPs 和 small indels 略占优势,然而,在Ensembl CDS 数据库中Agilent SureSelect Human All Exon kit能检测最多的SNPs和 small indels。所有这些平台都可以检测疾病相关的突变,但也各有特点。

在外显子组测序上的发现同样可以运用到一般富集方法和定制富集试验上。在设计定制探针富集的时候,一般会参考重叠高密度的探针和基因组的覆盖这两个参数。研究表明重叠高密度的探针能够提高灵敏度,重叠探针的数量的大小还不清楚。唯一清楚的是重叠探针设计在富集效率上要高于紧邻设计和间隔设计。此外,我们还发现相对长的探针或者Agilen SureSelect的RNA方法可以增加对indels检测的敏感性,因此,在设计定制探针时,长的探针更适合需求。

有争论说捕获测序只是一个短暂的过度,随着WGS价格的降低,它将会慢慢消失。然而,我们发现外显子组测序可以鉴定到WGS所没有鉴定到的突变,因为外显子组测序在富集之后将有更大的数据覆盖。在数据覆盖相同时,外显子组测序在特定的区域测序深度更大使得它在那些区域有更高的灵敏度。外显子捕获测序通过优先选择比对这个区域高频的Reads数可以清楚的鉴定一些很难界定的区域。这使得捕获测序在WGS后仍然还有很大的市场,它可以用在WGS低深度覆盖的区域,对于人类疾病的研究有很大的帮助。

由于文章发表在2014年,近来捕获测序的技术发展非常快,不仅有新的技术出现,而且文章中提到的3个公司对各自的产品也进行了优化,例如覆盖区域的扩大,实验流程时间缩短,最新的技术资料还请查阅各个公司产品目录。

上海欧易生物公司的捕获测序主要使用Agilent和Roche/Nimblegen两种系统。我们不仅可以进行常规样本的捕获测序项目,对非常规样本如石蜡样本、ctDNA样本等我们都有丰富的抽提及建库经验,针对ctDNA样本的起始量非常低的样本我们优化了实验流程,可以得到高质量的测序数据,为各位老师的研究提供优质的服务。

引用文献

Performancecomparison of exome DNA sequencing technologies,Michael J Clark et al,Nat Biotechnol. ;29(10): 908–914. doi:10.1038/nbt.1975

网友热评