SEARCH
技术服务021-34781616

热门搜索关键词:转录组基因组甲基化酵母文库蛋白芯片

021-34781616

当前位置首页 » 新闻资讯 » 技术&解读&应用 » 单倍型分析助力六倍体甘薯基因组组装

单倍型分析助力六倍体甘薯基因组组装

返回列表 来源: 查看手机网址
扫一扫!单倍型分析助力六倍体甘薯基因组组装扫一扫!
浏览:- 发布日期:2017-11-06 09:47:30【

2.实验方法

甘薯因为其基因组较大(4.4Gb,单套染色体大小在700M到800M之间),而且是六倍体物种(2n=6x=90,B1B1B2B2B2B2),杂合度也较高一直困扰着甘薯基因组研究人员。通过denovo基因组测序共获得~296 Gb 数据,粗略测序深度为67X。

成功组装出六倍体甘薯基因组序列,组装出大小约为836Mb,scaffold N50为201Kb左右,利用甘薯和其近缘野生种(Ipomoea nil)之间的共线性关系,将75.5%的组装序列锚定在15个pseudochromosomes 上。

测序平台选择:Hiseq2500 、GS FLX + platforms、Nextseq500 platform

1初始拼接

1)对原始的下机数据去冗余纠错,使用分析软件为:BFC package (https://github.com/lh3/bfc)

2)接下来拼接使用IDBA-UD

3)进一步的拼接使用NEWBLER 3.0

4)使用platanus构建补洞

5)使用blat比对软件,去掉scaffold序列相似度和覆盖度都大于85%的reads

6)使用platanus借助20kb的测序文库进一步构建scaffold

2单倍体序列分离

1)bwa序列比对,samtools对bam文件去冗余,使用Freebayes来call snp

2)Ranbow (https://www.molgen.mpg.de/ranbow)针对多倍体软件专门写的python模块来解析单倍体软件

算法原理图

算法个人理解

在某一个基因组滑动内,对出现的SNP进行统计,根据多倍体物种的特点,连续三个SNP出现的情况只能为图中seed格式。

3)在提取完单倍体序列后,又借助SSPACE对测序数据进一步构建scaffold.

使用BUSCO对测序完整性进行评估。

拼接结果如下


3基因注释

6个转录组数据与组装的结果进行比对分析并从中提取一致性基因序列,使用HISAT2、StringTie 与TACO 。另外在基因预测上还借鉴下载了10,063 条EST序列表达标签。并与NCBI与Uniprot 进行比对注释。使用RepeatMasker来预测重复序列。

甘薯基因组组装圈图

欧易生物

技术热线:021-34781616 咨询热线:4006-4008-26

上海市闵行区新骏环路138号5幢3层
service@oebiotech.com
欧易生物
欧易生物微信公众号
沪ICP备-050455 网站地图  Copyright © 2016 上海欧易生物医学科技有限公司 保留所有权利