SEARCH
技术服务021-34781616

热门搜索关键词:转录组基因组甲基化酵母文库蛋白芯片

021-34781616

当前位置首页 » 新闻资讯 » 技术&解读&应用 » 没有对应物种KEGG数据?

没有对应物种KEGG数据?

返回列表 来源: 查看手机网址
扫一扫!没有对应物种KEGG数据?扫一扫!
浏览:- 发布日期:2017-02-16 12:28:33【

KEGG(Kyoto Encyclopedia of Genes and Genomes)京都基因和基因组百科全书,是研究Pathway代谢通路的最主要数据库,整合了基因组信息、化学信息、系统信息及疾病和健康信息。

上一期,小编为大家介绍了KEGG数据库中已有物种的KEGG数据下载及处理方法-----“什么?KEGG数据你竟然还不会下载!!”。那么,如果我们研究的物种在KEGG官方数据库中搜索不到,是不是就没办法进行KEGG注释了呢?答案当然是否定的。

在KEGG数据库中,有一个“专有名词” KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K标签,KEGG orthology (ko)代表的是某个代谢途径,k代表的是某个酶,c代表的是某个化合物,M代表的是某个模块,后面都会跟着编号。)

对于酶来说,40-70%的序列相似性对于功能的预测有90%的准确性(Tian,W)。直系同源基于是来自于相同的祖先的基因分化,保存在不同的物种中的功能基因。在实际操作中,他们能够通过BBH(bi-directional best hit)来推测出来。因此,对在许多物种中的直系同源基因的鉴定是对新测序的基因功能预测的最便捷的途径。而KEGG 数据库就是通过KEGG Orthology (KO)系统来跨物种注释的一种机制。

说了这么多,到底该怎么做呢?请小编为您一一到来。

1.

打开KEGG官方自动注释网页 http://www.genome.jp/kaas-bin/kaas_main,填写对应信息,并提交任务。

2.

待任务上传完成,邮箱会收到一份邮件告知任务被接受,开始计算(有时可能需要邮件确认)。

3.

一段时间后(通常需要几个小时)任务完成,邮箱会收到一封邮件,提示任务已完成。

4.

打开上述邮件中链接,点击对应任务的html

5.

选择 brite hierarchies;然后点击KEGG Orthology(KO)

6.

在跳转出的网页中点击“Download htext”,弹出下载窗口下载q00001.keg,即为我们注视得到的KEGG数据。

7.

在Linux环境输入如下命令(当然也可以在Windows环境cygwin等类Linux软件执行,详情请参见软文“必备神器!!Windows上一款小软件竟能轻松运行Linux命令!!”):

awk '$1=="C"&& $NF~"PATH:" || $1=="D"' q00001.keg | grep -P "PATH|; K[0-9]+|\tK[0-9]+|\ K[0-9]+" |

sed 's#^C[[:space:]]*

awk 'BEGIN{FS=OFS="\t"}{if($NF~"PATH:") a=$3"\t"$2; else print $1,a}' |

awk 'BEGIN{FS=OFS="\t"}{a[$1]=a[$1]?a[$1]";"$2:$2;b[$1]=b[$1]?b[$1]"|"$3:$3} END{for(i in a)print i,a[i],b[i]}'|

sed 's#,\t|#\t#; s#\[PATH:#path:#g; s#\]

即可直接生成处理好的KEGG结果。需要说明的是,由于自己在KEGG官网根据物种序列注释得到的结果,因此第一列通常显示为序列的名称。

是不是很给力!快去试一下吧!!!

推荐阅读

    【本文标签】:KEGG
    【责任编辑】:欧易生物版权所有:http://www.oebiotech.com转载请注明出处

    欧易生物

    技术热线:021-34781616 咨询热线:4006-4008-26

    上海市闵行区新骏环路138号5幢3层
    service@oebiotech.com
    欧易生物
    欧易生物微信公众号
    沪ICP备-050455 网站地图  Copyright © 2016 上海欧易生物医学科技有限公司 保留所有权利