常见问题
1. 2b-RAD中所用的酶是一种什么类型的酶?这种酶有什么特性?如何进行选择?
2b-RAD所使用的是IIB型限制性核酸内切酶,是一类商业化的酶。这类酶在基因组上识别特定的碱基序列(一般为5-7碱基),然后在识别位点两侧进行双链酶切,全基因组范围内切出的标签片段等长,如:内切酶BsaXI切出的为等长的33 bp片段。针对有参物种,可通过对基因组进行电子酶切结合预期的标签数确定合适的酶,对于无参物种则可选用其近缘物种基因组序列进行电子酶切。
2. 2b-RAD片段短,怎么获取标记所在位置的基因信息?
首先,不管哪一种简化基因组技术(RAD、ddRAD、2b-RAD),都存在片段短不方便设计引物的问题。但这个问题也不是没办法解决:1、比对到近缘物种基因组;2、进行基因组survey测序,然后比对;3、chromosome walking。随着测序价格越来越低,基因组survey测序不失为一种更好地方法。比如,Jiao et al. (DNA Research, 2013) 通过基因组survey覆盖栉孔扇贝全基因组的70%,将栉孔扇贝的转录组测序数据与基因组Scaffold进行了比对,88.4%转录本有功能注释结果,表明基因组预测序结果中已经包含了大部分基因。
3. 标签这么短(33bp),基因组特异性会不会很差?
影响SNP分型准确率的一个重要因素是非特异性序列(多拷贝基因、重复序列等)的存在,1)序列过短可能会导致特异性不足,来自基因组多个位置的序列聚集在一起造成分型的错误;2)所采用的分型算法如果不能将非特异性序列有效剔除掉,也会造成SNP分型的假阳性。
根据我们在多个物种的实验和模拟数据,33bp长度的标签在大多数物种中具有较好的特异性,特异度大都在90%以上;数据还显示,继续增大读长并不会使序列的特异性有显著提升。并且,采用我们新的iML算法,可以有效的将非特异性标签剔除掉,保证SNP分型有较高的准确率。
简单而言,采用简化基因组技术,由于产生的标记数目都比较多,关注的重点不应该放在标记的数目如何留存更多,而应该更关注于如何保证所获得SNP标记的准确率。采用2b-RAD技术,在标记数目并没有明显降低的同时(保留所产生标签的90%以上),显著提升了分型的准确率。
4. 标签太短,后期验证时如何设计引物?
对于有参物种(或近缘物种有参),可根据SNP的位置信息获得其两侧的基因组序列,并据此设计引物;无参物种,无法直接获得其两侧序列,需要借助基因组survey数据或本物种的转录组数据(利用转录组数据时只有一部分位于编码区的SNP能获得两侧序列)。
5.送测数据量(reads条数)如何计算?
有参物种:基因组电子酶切标签数×要求的测序深度×1.5
无参物种:近缘物种基因组电子酶切标签数×要求的测序深度×1.5;无近缘物种基因组可用时,查询预估其基因组大小,按1Gb基因组能产生25万条标签计算(4Kb一个标签);实在无法判断基因组大小时,且样品量较多时,建议先用少量样品进行预实验,以确定合适的送测数据量。
6.样品测序深度?
为了保证分型结果的可靠性,对于一般项目(如群体遗传类),要求各样品的测序深度不低于15×;对于遗传图谱构建类的项目,要求亲本测序深度不低于30×,子代不低于15×。在对酶切片段连接接头的过程中,如果接头的粘性末端3个碱基为NNN,则可以将所有酶切片段回收。但如果接头的粘性末端3个碱基中存在一个选择性碱基,比如NNA,理论上就可以将标签数量降到总标签数量的1/4;如果采用兼并碱基,比如NNR,理论上就可以将标签数量降到总标签数量的1/2。如此,通过选择性碱基的合理使用,就可以达到获得任意标签密度的目的。
7. 什么样的物种适合利用2b-RAD技术进行研究?
目前,2b-RAD技术主要应用于二倍体生物。二倍体动植物,无论基因组大小,均可采用2b-RAD技术进行基因组简化测序。因为2b-RAD技术可以实现标签密度的灵活控制,原则上而言,基因组大小对于最终产生的2b-RAD的标签数目影响不大,这是该技术区别于其他RAD类技术的一大优势。理论上而言,基因组上每3~4K存在一个识别位点,可以切出33bp的标签,根据基因组大小,可以估算出可获得标签的大致数目。同时,2b-RAD技术可以检测基因组中的几乎所有酶切位点,其他RAD类技术只能检测部分酶切位点,这是该技术的另一大优势。从生物信息学的角度来看,等长片段和识别位点在序列中间使得聚类这一步更容易,尤其是对于缺少基因组的物种。目前,2b-RAD技术研究过的物种涵盖细菌(单核增生李斯特菌)、植物(拟南芥、玉米、二穗短柄草、西瓜、百合等)和动物(黄鳍金枪鱼、大头鱼、鲯鳅、栉孔扇贝、贻贝、中华绒螯蟹、刺水蚤、果蝇、珊瑚等)。
8. 存放了许久的样品或者发生降解的DNA能进行2b-RAD测序吗?
完全可以。这正是2b-RAD技术的一大优势,这是因为该技术的酶切标签为长度一致的短片段(~33bp),一定程度的DNA降解并不会影响实验结果。经实验证明,50bp的片段也可用2b-RAD进行建库测序。