分子生物学高端技术科研服务专业平台获得Affymetrix、Agilent两大平台服务资质认证

首页 技术&解读&应用

功能基因筛选干货系列?MBS(四)

2016-11-30 15:54:29 

上期小编为大家介绍了突变定位和鉴定的各种方法,本期将为大家介绍无参基因分型的方法。本期是《功能基因筛选干货系列•MBS》的第四期也是最后一期。

Linkage- and reference-sequence-free methods

需要参考基因组信息是大多数MBS方法的一个主要限制。除作为测序reads的比对目标之外,参考序列也能够当做遗传图谱来用。参考序列提供了众多标记的线性关系,而与突变表型有关的区域需要用这些标记来筛选。参考序列可以为相关物种所使用,作为一种替代方案,共线同源染色体区域信息也可提供大概的标记顺序。

理论上,在突变重组体池和野生型池间唯一“修正”(含义详见后文名词解释部分)的差异是与突变有关的。已经证明通过关注“修正”的池间差异这样一个简单的不受任何连锁信息约束的策略,无需遗传连锁信息就能鉴定有关突变。部分参考序列并不是完整的全长序列,但是可以用于MBS,如果它们只需要用作比对而不是当做遗传图谱来用。对诸多非模式生物来说这是一个巨大的优势,因为它们基于NGS的装配高度碎片化,且不提供连续序列。这个优势使得MBS数据甚至可以建立一个特设参考序列(图1a),这不仅对基于DNA测序的MBS成立,对基于RAD-seq和RNA-seq的MBS也成立。

举个例子,利用16个太阳花重组个体混的2个池的转录组数据——它们中一个是霜霉病易感的,另一个是有抗性的——来源于两个分离系的杂交,有一个研究[1]描述了无参转录组的拼接。该文作者随后将两个池的reads分别按叠连群重新调整,以寻找基因差异。因为基于RNA-seq的叠连群并不包含基因顺序信息,不能作为遗传图谱来用,它们只是筛选两池间完全“修正”了的差异。该研究筛选了219个候选基因,其中42个与抗性基因有关。

短读长序列分析算法中近来引进了一个无需参考序列的基因组比较方法。这个方法基于短读长数据可以鉴定2个或更多样本间独有的“修正”了的差异,甚至不需要任何拼接。在该方法的第一次应用[2]中,比较了来源于两个独立的EMS诱变的2个A. alpina(一个没有参考序列的开花植物)突变体池数据。该突变重组体由原始突变体与其纯合亲本回交后一次自交得到。这个池仅可以被它们“修正”的突变所区分。无需参考序列的基因组比较分析找到了29个突变,其中10个对基因的编码能力有一些影响,包括两种突变表型的相关基因。

此外,作者演示了突变鉴定可以像直接比较两个独立等位突变基因(同一个基因的隐性纯合子)的基因组一样简单。利用无需参考序列的基因组比对,作者比较了2个A. alpina开花时间变异的M2代基因组。全基因组范围的比较揭示了总共779个纯合突变,来区分这些基因组,若不采用该方法,这两个基因组通常会被认为是相同的。其中超过250个突变与基因重叠;然而,两个基因组这么多的突变当中只有一个基因受到了比较大的影响,这个基因与变异表型有关。

这个实验代表了正向遗传学一个历史性的突破。结合WGS的基因组比较方法,第一次让突变鉴定不需要杂交、遗传图谱或者任何类型的连锁信息(图1b)。

图1 Mutation identification without linkage information,reference sequences and recombination.

Future directions

用正向遗传学筛选、分离突变是链接表型和其决定基因的成功策略之一。简单粗暴进行突变鉴定且无需参考序列的新方法甚至适用于具有复杂的遗传背景和非模式的生物。为保证这些方法的可用性,需要制作简单易用的软件,制定学术界普遍接受的标准,并能够用于大多数常用的实验设计。对现有的混池基因组等位基因分析软件的选择展示在表1。相比之下,测序技术的近期进展使重组群体中的个体基因组分析成为可能。无独有偶,混池基因组分析仍是一个很受欢迎的替代方案,因为它便宜而且能驾驭极多数量的样本。因此,基于BSA的测序策略快速用于自然遗传多态性中复杂位点的研究并不令人惊讶。

表1 A representative selection of tools supporting mutationidentification

百年前减数分裂重组就已是突变鉴定的常用工具。目前突变定位依赖于重组,低(或者有些时候完全抑制的)频率决定了其结果很难预测。现有研究已经证明,突变鉴定可以通过简单的比较突变型和野生型基因组来实现,将突变鉴定从重组群体构建的工作中解放出来。

在未来几年,测序花费将降到足够低,正向遗传学筛选可以直接用测序寻找每个突变个体,不过这种筛选会相当大地受到实验设计的影响。即使筛选的突变并非明显的等位基因,根据在独立的突变系中影响的基因对它们分组,将揭示影响观察到的表型的等位基因。随后有针对性的互补试验或互补转基因可以快速确认这些突变是否与表型有关。由于不依赖于任何作图群体,这个方法(不会比能得到所有突变基因组上突变的WGS要求得更多)将快速产生候选基因,特别是,如果筛选至少涉及某些基因的多个等位基因(类似饱和筛选),就更加如此。

因为有了高通量高效率的NGS,以测序为基础的突变鉴定方法即将代替基于重组群体的遗传定位。很快,图变定位将不再需要附加巨大的复杂模型系统(比如多世代或多倍体增加复杂度),且能够在没有参考序列、未经人工培养的物种中进行。

相关常见学术名词解释

Forward genetic screens

Genetic screens in which mutants are isolated on the basis of theirphenotypes. The mutations responsible are identified by positional cloning orby a candidate gene approach.

Dominance

A genetic interaction between the two alleles at a locus, such that thephenotype of heterozygotes deviates from the average of the two homozygotes.

Penetrance

The proportion of individuals with a specific genotype who manifest thegenotype at the phenotypic level. If the penetrance of an allele is 100%, thenall individuals carrying that allele will express the associated phenotype, andthe genotype is said to be completely penetrant.

Fixed(修正)

Pertaining to the point at which an allele (such as a mutation) hascompletely displaced other alleles; that is, the allele is present in ahomozygous state in every individual in the population.

Second-sitemutations

Mutations introduced in organisms that are already genetically compromisedfor a pathway or process in order to isolate mutations that either suppress orenhance the effect of the first mutation.

RAD sequencing

(RAD-seq). A DNA sequencing method in which DNA is cut with restrictionenzymes prior to sequencing, which exclusively targets the DNA associated withrestriction sites.

Syntenic

Pertaining to the presence of collinear homologous DNA sequences inrelated chromosomal regions.

Epistatic interactions

Non-additive interactions between two or more mutations at different loci,such that their combined effect on a phenotype deviates from the sum of theirindividual effects.

Saturated screens

Genetic screens that have reached the point at which no new gene mutationscan be found.

FURTHER INFORMATION:Related Softwares

CloudMap:http://hobertlab.org/cloudmap

Fishyskeleton:http://fishbonelab.org/harris/Resources.html

MegaMapper:http://www.digitalfish.org/MegaMapper

MMAPPR:http://yost.genetics.utah.edu/software.php

Multipool:https://github.com/matted/multipool

MutMapand MutMap+: http://genome-e.ibrc.or.jp/home/

bioinformatics-team/mutmap

NGM:http://bar.utoronto.ca/NGM

RNAmapper:http://www.rnamapper.org

SHOREmap:http://shoremap.org

SNPtrack:http://genetics.bwh.harvard.edu/snptrack

以后小编将继续为大家带来功能基因筛选干货系列的其他内容,需要的同学请多留意哦。

参考文献

[1] M. Livaja, et al. BSTA: a targeted approach combines bulked segregantanalysis with next-generation sequencing and de novo tranome assembly forSNP discovery in sunflower. BMC Genomics.14, 1: 628 (2013).

[2]K. J. Nordstrom, et al. Mutationidentification by direct comparison of whole-genome sequencing data from mutantand wild-type individuals using k-mers. NatBiotechnol. 31, 4: 325-330 (2013).

网友热评