KEGG官方工具能够完成任何物种的KEGG注释!!!
写在前面
之前介绍过使用EggNOG-mapper
对非模式物种快速完成KEGG注释的推文https://mp.weixin.qq.com/s/kIf6C2u3FID3ZeLtsB4eZQ
,不过毕竟EggNOG-mapper
是第三方软件,而且注释结果仍然存在一个Gene ID对应多个KO Number的情况,虽然对富集结果影响似乎不会太大,但是影响多少肯定是会有。
这里介绍KEGG官方提供的注释工具KofamKOALA,同样能够对任意物种进行KEGG注释,注释结果中Gene ID对应唯一一个KO Number,避免了大多数第三方注释工具一个ID对应多个KO Number的情况,使富集结果更加可靠!
本教程含「在线版」和「本地版」,满足各类注释场景。
KofamKOALA官网https://www.genome.jp/tools/kofamkoala/
一、网页版KofamKOALA
点击提交任务之后需要在邮件中二次确认,提交任务
注释完成之后,点击邮件中的链接
在结果页面中,可以直接下载注释结果,然后接着用TBtools进行富集分析
同时也提供了许多对注释结果的探索功能,比如查看注释上的KO Number详细信息,比对情况等。
二、本地化KofamKOALA
如果需要注释的序列太多,文件太大,使用网页版工具确实可能会太慢。这个时候当然是选择将其本地化!在本地根据服务器情况提高线程加速注释。
下载 KOfam 和 KofamScan
下载并解压KOfam
wget https://www.genome.jp/ftp/db/kofam/ko_list.gz
wget https://www.genome.jp/ftp/db/kofam/profiles.tar.gz
#下载完成之后解压
gunzip ko_list.gz
tar -xzvf profiles.tar.gz
下载并解压kofam_scan
wget https://www.genome.jp/ftp/tools/kofam_scan/kofam_scan-1.3.0.tar.gz
tar -xzvf kofam_scan-1.3.0.tar.gz
将kofam_scan加入环境变量
echo export PATH=/home/jiawei_li/tools/kofamscan/kofam_scan-1.3.0:\$PATH >> ~/.bashrc
source ~/.bashrc
安装依赖,KofamScan需要Ruby,HMMER和GNU Parallel
#版本需求
- Ruby >= 2.4
- HMMER >= 3.1
- GNU Parallel
conda安装Ruby,自己编译也行 但是我比较懒折腾。。。
conda install -c conda-forge ruby
如果喜欢手动装Ruby,也可以试试,但也许会报错,需要进行一系列操作去安装
wget https://cache.ruby-lang.org/pub/ruby/3.1/ruby-3.1.0.tar.gz
tar -xzvf ruby-3.1.0.tar.gz
cd cd ruby-3.1.0
./configure
make
make install
安装hmmer
conda install -c bioconda hmmer
安装GNU Parallel
conda install -c conda-forge parallel
修改配置文件,指定依赖软件以及KOfam的路径
首先获取相关软件的路径(注意:配置文件中不需要指定Ruby的路径,但是需要确保Ruby加入了环境变量,能够直接调用)
which parallel hmmscan
#/tools/parallel
#~/miniconda3/bin/hmmscan
使用官方模板,修改配置文件
cd kofam_scan-1.3.0
cp config-template.yml config.yml
注意,由于hmmscan和parallel都已经加入环境变量,可以直接调用,因此在配置文件中无需配置这两个软件的路径
# Path to your KO-HMM database
# A database can be a .hmm file, a .hal file or a directory in which
# .hmm files are. Omit the extension if it is .hal or .hmm file
profile: /home/jiawei_li/tools/kofamscan/profiles# Path to the KO list file
ko_list: /home/jiawei_li/tools/kofamscan/ko_list# Path to an executable file of hmmsearch
# You do not have to set this if it is in your $PATH
#hmmsearch: /home/jiawei_li/miniconda3/bin/hmmscan# Path to an executable file of GNU parallel
# You do not have to set this if it is in your $PATH
#parallel: /tools/parallel# Number of hmmsearch processes to be run parallelly
cpu: 8
对蛋白序列进行注释(注意:注释序列必须为蛋白序列)
exec_annotation -o test.querry2KO --cpu 8 --format mapper -E 1e-5 test.pep.fa
注意: --format
参数在help中给出了四种,但主要有两种格式。
#help文档中的解释-f, --format <format> Format of the output [detail]detail: Detail for each hits (including hits below threshold)detail-tsv: Tab separeted values for detail formatmapper: KEGG Mapper compatible formatmapper-one-line: Similar to mapper, but all hit KOs are listed in one line
--format mapper
对每一个Gene ID只保留最佳的KO Number,结果文件只含有Gene ID和KO Number的映射信息。
--format detail
保留所有信息,包括Gene ID对应上的每一个KO Number,比对分数,E-value以及KO Number的详细信息等。
最后,拿到query2KO文件之后,就可以用其当背景文件,使用TBtools对基因集做富集分析啦
猜你喜欢
iMeta简介 高引文章 高颜值绘图imageGP 网络分析iNAP
iMeta网页工具 代谢组MetOrigin 美吉云乳酸化预测DeepKla
iMeta综述 肠菌菌群 植物菌群 口腔菌群 蛋白质结构预测
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树 必备技能:提问 搜索 Endnote
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流快速解决科研困难,我们建立了“宏基因组”讨论群,己有国内外6000+ 科研人员加入。请添加主编微信meta-genomics带你入群,务必备注“姓名-单位-研究方向-职称/年级”。高级职称请注明身份,另有海内外微生物PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
点击阅读原文,跳转最新文章目录阅读
KEGG官方工具能够完成任何物种的KEGG注释!!!相关推荐
- windows无法完成安装 若要在此计算机上安装_全新安装Windows10 2004的技巧,官方工具,安全高效...
Windows 10 2004已经正式发布,如果想全新安装Windows10 2020年5月更新,而不是从以前的版本(例如2019年11月更新)升级,则可以使用媒体创建工具(Media Creatio ...
- arcgis超级工具安装教程_【软件安装管家】Autodesk卸载官方工具安装教程
点击上面"蓝字"关注,获取更多资源!用心分享 一黑一白我不是灵魂导师一个分享软件/影视/音乐/网站/教程的公众号星标/置顶公众号?因公众号改版,不再按时间推送文章,为不错过最新资源 ...
- 安装oracle到create inventory时卡住了怎么办_win10系统安装教程(官方工具)
Hi,大家好. 对于小白用户,装系统是比较头疼的事,所以今天写一个简单易懂的装系统教程. 使用微软官方提供的工具制作U盘启动盘,操作简单,系统纯净,强烈建议小白用户使用.缺点是该工具功能单一,并且官方 ...
- cad官方卸载工具_【软件安装管家】Autodesk卸载官方工具安装教程
点击上面"蓝字"关注,获取更多资源!用心分享 一黑一白我不是灵魂导师一个分享软件/影视/音乐/网站/教程的公众号星标/置顶公众号?因公众号改版,不再按时间推送文章,为不错过最新资源 ...
- 使用微软官方工具下载最新系统(win10为例)
本文将教你使用微软官方工具下载最新系统(win10为例)以及制作win10的安装引导U盘. 1.工具下载地址: https://www.microsoft.com/zh-cn/software-dow ...
- 如何使用微软官方工具制作win10启动盘(附带微软官方工具地址)
最近把自己的电脑又玩坏了,打算重装系统.无奈老的系统盘里的系统版本太老,升级起来费时费力,加上无奈的校园网,看到的只有失败,所以打算重做一个版本较新的系统. 可是网上制作系统盘工具众多,到底选哪一款好 ...
- (微软官方工具)局域网键鼠共享工具:Mouse without borders
局域网键鼠共享工具:Mouse without borders(微软官方工具) 安装 官方下载地址:https://www.microsoft.com/en-us/download/details.a ...
- 【MTK官方工具】最好用的MTK官方工具
[MTK官方工具]最好用的MTK官方工具 需要的同鞋请回原文下载
- Windows安装教程(Microsoft官方工具安装+PE安装教程,以及GPT分区、UEFI模式安装win7教程)
本文主要介绍两种Windows安装方法.以及如何在GPT分区.UEFI模式中安装win7 两种方法各有优缺点. 第一种方便,PE里面很多功能,你的电脑出了什么毛病基本上都能通过PE解决.而且能安装各个 ...
- [联想官方工具]关闭Win10自动更新工具 最新版 2.6.21.816
[蓝奏云下载]Lenovo Quick Fix:关闭或开启Win10系统的自动更新 来源:联想知识库-[联想官方工具]关闭Win10自动更新工具 2.6.21.816 下载链接:下载:https:// ...
最新文章
- IIS7.5部署ASP.NET失败
- 清单革命:为什么不仅是工具革命?
- Servlet实现登录注册
- MyBatis传入参数为List对象
- java system.out.read_求教Java高手,关于输入流的read的问题,为什么while循环体里面的两个System.out.println没有打印出来?...
- 转:SQL Server游标的使用
- jquery中获取下拉框的文本值
- php 去除图片黑边,C#_c#扫描图片去黑边(扫描仪去黑边),自动去除图像扫描黑边复制代 - phpStudy...
- linux so 库的生成与调用
- Linux虚拟化KVM-Qemu分析(四)之CPU虚拟化(2)
- 无线通信技术协议-Zigbee 3.0
- Linux系统下配置JDK环境变量
- CentOS 7搭建tengine+php+mariadb环境并安装discuz论坛
- 打开struts-config.xml 报错 解决方法Could not open the editor
- 百度离线地图-Vue
- 重庆人文科技学院计算机学院院长,我校计算机工程学院成立大会圆满闭幕
- python爬虫爬取大学排名并存入数据库进行数据可视化
- weui.js中的picker自定义实现移动端联动
- 视觉定位系统怎么实现定位及引导贴合的应用?视觉定位系统案例详解
- 简易图书管理系统(主要是jsp+servlet的练习),基于jsp+servlet的图书管理系统