1. KEGG数据下载
    打开kegg官网:
    http://www.genome.jp/kegg/catalog/org_list.html

    然后点击相应物种前面三个字母缩写位置进入下载界面:

    然后点击相应的格式进行下载,我们最常用的下载格式是htext
    下载到.keg 格式的文件
    我下载的是人的全部的KEGG文件,其文件名称为hsa00001.keg

  2. 文件探索
    2.1 初步看看各种通路信息

grep '^C' hsa00001.keg | tail

2.2 看看共有多少通路信息

 grep '^C' hsa00001.keg | grep "hsa" | wc#     370    2205   19727
  1. 文件解析
    3.1 第一种解析
awk '$1=="C" &&$NF~"PATH:" || $1=="D"' hsa00001.keg | grep -P "PATH|\tK" | sed 's#^C[[:space:]]*##; s#^D[[:space:]]*##; s# \[#\t\[#; s# #\t#' | awk 'BEGIN{FS=OFS="\t"}{if($NF~"PATH:") a=$3"\t"$2;else print $1,a}' | awk 'BEGIN{FS=OFS="\t"}{a[$1]=a[$1]$2",";b[$1]=b[$1]"|"$3; next}END{for (i in a) print i,a[i],b[i]}' | sed 's#,\t|#\t#; s#\[PATH:#path:#g; s#\]##g' > KEGG_ath.txt

解析完成后文件储存在KEGG_ath.txt 文件中
head KEGG_ath.txt 即可看到下面的文件


第一列是 entrez genes ID, 第二列是path KEGG ID,第三列是通路的具体解释
3.2 第二种解析

perl -alne '{if(/^C/){/PATH:hsa(\d+)/;$kegg=$1}else{print "$kegg\t$F[1]" if /^D/ and $kegg;}}' hsa00001.keg >kegg2gene.txt
  1. 解析文件探索
head kegg2gene.txt
cut -f 1 kegg2gene.txt | sort -u | wc

参考文件:
http://www.bio-info-trainee.com/1188.html
http://shemy.site/2016/12/29/KEGG-2/

KEGG 通路信息下载及其相关处理相关推荐

  1. linux下kegg注释软件,KEGG数据库-pathway对应基因的注释信息下载

    KEGG数据库-pathway对应基因的注释信息下载 KEGG数据库pathway相关数据下载 我们下载KEGG数据库的目的是为了研究目标蛋白参与了那些pathway . 前面我们介绍了KEGG 数据 ...

  2. Pathview包:整合表达谱数据可视化KEGG通路

    Pathview是一个用于整合表达谱数据并用于可视化KEGG通路的一个R包,其会先下载KEGG官网上的通路图,然后整合输入数据对通路图进行再次渲染,从而对KEGG通路图进行一定程度上的个性化处理,并且 ...

  3. 20W+喜爱的Pathview网页版 | 整合表达谱数据KEGG通路可视化

    Pathview网站简介 网址:https://pathview.uncc.edu/ 前段时间介绍了一个R包 - Pathview.它可以整合表达谱数据并可视化KEGG通路,操作是先自动下载KEGG官 ...

  4. 如何获取kegg通路的基因列表

    如何获取kegg通路的基因列表?相信很多人都有这个疑惑. 哪些时候需要知道通路的基因列表?举两个例子: 在找差异基因这一步,只想针对特定通路的基因去找.可以在找完差异基因后,和通路的基因列表取个交集. ...

  5. Pathview绘制KEGG通路图

    今天小编和大家分享一个在KEGG通路分析中可能会经常用到的一个R包,名字叫Pathview.我将分五期进行,从快速上手,再到高级用法,最后在用实例对这个包做一个较全面的讲解.下面我们先简单了解一下这个 ...

  6. DITA达尔文信息类型化体系结构相关总结

    DITA达尔文信息类型化体系结构相关总结 Dennis Hu 2014年12月12日 说明:近期做了一个项目评估,接触到DITA相关的信息,这里给自己做一个简单的总结,也希望给其他将来可能会涉及到的朋 ...

  7. AS:Flash AS3中获取浏览器信息及URL相关参数(并非swf url地址)

    原文链接:AS:Flash AS3中获取浏览器信息及URL相关参数(并非swf url地址) 好久没来这里了,最近发现网络上对此类信息的封装少的可怜,没有一个是比较完整的,今天又是周未,不敲点代码手痒 ...

  8. Python爬取De下载站相关代码

    Python爬取De下载站相关代码,因为没有设置代理,所以爬到800页左右就被干掉了,后续要加上 import urllib.request import bs4 import re import t ...

  9. 计算机专业校企合作协议,校企合作协议(计算机应用类、电子商务类、信息类等相关专业)...

    校企合作协议书 甲方: 乙方: 校企合作协议书 甲方: 地址: 法定代表人: 项目联系人: 乙方:地址: 法定代表人: 项目联系人: 一.合作内容 1.建立稳定的专业实践教学基地(计算机应用类.电子商 ...

  10. metascape中聚类,然后对其中KEGG通路中基因进行定位

    metascape是一个比较好的进行基因聚类分析的网站. 聚类后会发现有一些基因聚集到了KEGG通路中,但是这些基因具体在通路中的哪一个位置起作用,. 具体的基因可以通过点击图片中的Web得到对应的基 ...

最新文章

  1. 映射到此登录名的用户_小课堂:什么是数据映射以及如何进行数据映射
  2. 苹果后门、微软垄断与Linux缺位
  3. 关东升的《从零开始学Swift》3月9日已经上架
  4. 总结了点React,咱也不敢说
  5. 华为手机logcat不出日志解决方案
  6. plt.savefig 不保存边框_Matlab科研绘图 amp; 保存
  7. 【英语学习】【WOTD】veritable 释义/词源/示例
  8. HTML表格的简单使用1
  9. 阿里云搭建流媒体服务器
  10. mysql单实例安装
  11. 关于使用struts2上传文件时获取不到文件内容的问题的解决方案
  12. MySQL-----pymysql模块
  13. cj20n sap 报错未知列的名称_SAP,PS模块配置和操作手册
  14. markdown测试文章
  15. 当powergui fft 中empty
  16. 延时关机命令 linux,Ubuntu自动定时关机的方法
  17. python抢票脚本github_春运买不到票?程序员喊你来GitHub上用抢票神器!
  18. 备战金九银十 你必须知道的Mybatis面试题
  19. Android 亮屏流程分析
  20. Toward Fast, Flexible, and Robust Low-Light Image Enhancement(论文阅读)

热门文章

  1. 时间序列复杂性的度量—近似熵和样本熵
  2. python 内存不足_python内存不够
  3. ElacticSearch索引,文档,记录,常用指令
  4. 干部身份、三方协议、派遣证(转)
  5. 《UnityAPI.Animator动画器》(Yanlz+Unity+SteamVR+云技术+5G+AI+VR云游戏+Animator+avatar+CrossFade+Key+立钻哥哥++OK++)
  6. 微信H5禁止分享功能
  7. GPS定位原理、系统组成及工作频段
  8. STM32CubeIDE HAL库微秒us的延时Delay实现
  9. java基础 Day05 内部类、Object类、匿名内部类;方法的覆写;抽象类和接口
  10. note2便携式WLAN热点开启后没连接时自动关闭时长在哪设置