行业讯息

De novo文章不好发?换个思路试一试!

前 言

随着三代测序技术的发展和测序成本的下降,越来越多的物种实现了高质量、染色体级别的基因组组装。就目前发表文章的趋势来看,仅仅完成一个物种高质量染色体级别de novo组装的基因组就可以发表一篇高分文章的时代已经成为过去,如何让de novo组装的高质量基因组服务于生物学现象的解释和生物学问题的解决,才是研究者需要更多思考和关注的方面。基于此,本文整理了两篇de novo 基因组组装与群体相结合的代表性文章,希望对科研小伙伴们在课题设计与文章写作思路方面有所帮助。

 

例 1:Nature Communications

PacBio三代测序组装海枣树雄性个体基因组,并利用该基因组进行了性别决定区和21个果实性状的GWAS分析。

De novo文章不好发?换个思路试一试

发表期刊:Nature Communications

发表时间:2019.10

 

背景介绍

海枣树是中东和北非地区的标志性物种和主要作物,以其甜美的可食用果实而闻名。海枣树是雌雄异株、专性异交且高度杂合的单子叶物种,正常生长环境下为无性繁殖。海枣是最古老的多年生驯化作物之一,驯化后的品种呈多样化,如今已有3000多个已知品种在颜色、大小、湿度和含糖量等与水果相关的性状上表现出显著差异。GWAS不仅规避了世代周期长的问题,而且高水平的核苷酸多样性(SNP)和相对快速的连锁不平衡(LD)衰减[~20-30kb]可以实现高分辨率作图。为了对海枣树进行GWAS,研究者利用三代测序技术完成了一株雄性海枣树的基因组组装,并对位于两个农场的海枣树群体进行了全基因组重测序。利用组装数据和重测序得到的SNPs,对海枣树的关键性状进行GWAS分析。

 

主要结果

1. 对BC4的雄性海枣树进行PacBio三代测序和基因组组装(图1)。

流式细胞仪测定的海枣树基因组大小为870-899Mb,组装产生的主要组件跨度为772.3Mb,占预估基因组的86-89%,N50为70.9kb,基因组拼接完整性评估BUSCO20≥92.4%。与已发表信息相比,在基因组组装的完整性和组装质量上都有显著提升。

De novo文章不好发?换个思路试一试

图1 | BC4雄性海枣树基因组组装

 

2. 对海枣树已知的性别决定位点进行GWAS作图,对组装的基因组进行验证。

共选用来自2个农场种植的无显著群体差异特征的157个个体(其中145个雌株,12个雄株),进行基因组重测序,然后利用SNP进行GWAS分析, 将海枣树的性别确定区域映射到LG12的远端,与前人的报道一致。

 

3. 对21个水果性状进行GWAS分析。

分析结果显示,包括果实大小和部分果酸含量(反丁烯二酸、柠檬酸、苹果酸、琥珀酸、草酸和酒石酸)在内的大多数性状之间没有显著的关联,但水果颜色和糖分组成的定位显示出显著的表型与位点的相关性。

 

4. 对果皮颜色性状变异的遗传位点进行具体分析(图2)。

通过对果皮颜色、花青素水平、果皮颜色的GWAS位点分析、VIR等位基因位点变异分析、基因型与表型关联、红果和黄果两个品种果实发育过程中VIR表达的RNA-Seq分析等多角度、多维度解析,将果皮颜色变异与VIR位点关联起来,最终揭示海枣树果实颜色多态性是由编码R2R3-MYB转录因子的基因突变引起的。

De novo文章不好发?换个思路试一试

图2 | 海枣树果皮颜色变异的遗传分析

 

5. 对果实中糖分组成进行GWAS定位及候选基因的功能特征分析(图3)。

将果糖含量映射到一个基因组区域,该区域包括分离海枣树种群缺失多态性的转化酶。RNA-seq分析显示,细胞壁转化酶基因在不同果糖成分的品种间表现出较大的表达差异,可能是导致这一性状的原因。

De novo文章不好发?换个思路试一试

图3 | 海枣树果实中糖分组成的GWAS定位及候选基因的功能特征

 

主要结论

研究结果支持了关键的驯化和多样化特征是由同源基因在不相关类群中的进化趋同驱动的观点,即表型趋同/平行是作物驯化的一个标志,是在不同的人类文化背景下作用于不同作物物种的相似选择压力的结果。

 

例 2:Mol Plant

PacBio三代测序构建紫花苜蓿高质量染色体级别基因组,并对162份苜蓿品种进行群体遗传学分析。

De novo文章不好发?换个思路试一试
 

背景介绍

苜蓿是世界上最重要的饲料作物之一,但由于缺乏高质量的参考基因组,其分子遗传学和育种研究受到阻碍。紫花苜蓿由多年生、异交、63个形态分化但经常干扰的类群组成。苜蓿二倍体和同源四倍体亚种。M sativa subsp. caerulea (ssp. caerulea)是一个二倍体亚种,已被鉴定为四倍体栽培苜蓿的祖先,而栽培苜蓿(Medicago sativa ssp sativa, 2n = 4x = 32)则是一个同源四倍体。这些亚种杂种在许多数量性状上表现出杂种优势。

 

主要结果

1. 通过PacBio三代测序、BioNano测序和Hi-C测序,组装了816 Mb高质量染色体水平的单倍体基因序列“zhongmu 1号”( 一个杂合的同源四倍体)。

Contig N50为3.92Mb。基因组中注释到的基因有49,165个,推测紫花苜蓿的基因组在大约800万年前(Mya)与M. truncatula发生了变异分歧。

 

2. 对162份材料进行了30多个重要农艺性状的GWAS分析。

为了识别与关键农艺性状相关的候选基因,利用全基因组SNP数据和美国国家植物种质系统表型数据对162个全球核心种质进行了GWAS,确定了与30多个农艺性状相关的100多个候选区域,包括抗病性、抗虫性、生长、形态、产量和胁迫反应。研究者发现,在这些基因中,每个FT基因的序列和拷贝数是相同的,这表明FT的差异表达不是由序列或拷贝数变化引起的。GWAS定位和表达模式分析结果表明,FTa2表达差异可能影响株苜蓿的秋季休眠和耐盐性。

De novo文章不好发?换个思路试一试

图4 | 紫花苜蓿重要性状的GWAS分析

 

主要结论

研究者报道了一个高度连续染色体水平的同源四倍体紫花苜蓿基因组,并对162份材料进行了群体分析。群体基因组分析表明,二倍体群体基因的频繁导入降低了栽培苜蓿的群体结构,提高了遗传多样性。这些结果为了解紫花苜蓿基因组的进化和群体结构的薄弱提供了依据。GWAS分析确定了可以有效控制重要农艺性状的目标区域。msFTa2 可能与苜蓿在全球分布的几个关键性状有关,是价值靶基因鉴定的一个例子,可以为今后的功能研究和分子育种提供帮助。这些新的基因组资源将提高苜蓿的利用,为苜蓿的研究提供一个参考模式。

 

编者按

欧易生物拥有专业的动植物基因组研发团队,为客户提供从PacBio三代测序、de novo组装、基因注释、基础分析,到比较基因组、个性化分析及多组学联合分析(转录组/代谢组/群体进化/GWAS/ BSA/ QTL/遗传图谱)等高质量的技术服务,博士级专业人员,经过多年经验沉淀积累,具备多角度分析问题能力,提供多元化项目技术服务,多组学技术平台联合支撑,极力打造一站式服务。

 

END

上一篇:“玩转盛夏”——欧易集团8月“sunshine”活动第一弹下一篇:单细胞测序技术揭示小鼠皮肤损伤修复过程中成纤维细胞的异质性