细菌和真菌的次级代谢机制使其成为具有潜在药用价值的生物活性化合物的丰富来源,包括抗生物、降胆固醇药物或抗肿瘤药物。部分化合物在微生物体内的生物合成途径已经被鉴定,有意思的是,编码负责产生这种次级代谢产物的基因通常在染色体上成簇存在,因此被称为“生物合成基因簇”。这种遗传结构为通过定位其基因簇直接检测次级代谢物生物合成途径提供了可能性。近年来,细菌和真菌的测序成本已大大降低,并且许多基因组序列已经公布。基于某类基因簇中特异性基因的隐马尔可夫模型,antiSMASH 能够准确地识别编码所有已知类别的次级代谢产物的基因簇。antiSMASH 不仅可以检测基因簇,还可以提供详细的序列分析,下面介绍 antiSMASH 的安装步骤。

------我是分割线------

# 下载和安装 miniconda

wget https://mirrors.ustc.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh

# 下载完成后,在终端键入 bash 命令进行安装

bash Miniconda3-latest-Linux-x86_64.sh

# 之后按照提示点击回车,输入要安装的位置,或者输入 yes,输入 yes 后,还没有完成最后安装,还需要 source 一下

source ~/.bashrc

# 输入“conda list”来查看已经安装的软件

conda list

# 添加 channels

conda config --add channels conda-forgeconda config --add channels defaultsconda config --add channels rconda config --add channels biocondaconda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda/conda config --set show_channel_urls yes

# 查看已经添加的 channels

conda config --get channels

# 创建名为 bioinfo 的环境

conda create -y --name bioinfo python=3

若报错

Collecting package metadata (current_repodata. json): failed

Conda HTTP Error: HTTP 000 CONNECTION FAILED for url

Elapsed: An HTTP erroroccurred when trying to retrieve this URL.

HTTP errors are often intermittent, and a simple retry will get you on your way.

'https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/noarch'

# 说明缺少该 channel,conda 添加该 channel 即可

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/noarch

# 激活 bioinfo 环境

source activate bioinfo

# 更新 miniconda

conda update conda

# 输入该命令后,如果出现如下错误

PackageNotInstalledError:Package is not installed in prefix.

prefix:/home/lhc/miniconda3/envs/bioinfo

package name: conda

# 这个时候不用慌,把终端关掉重新开启就解决了

# 下面进行 antiSMASH 的安装

# 创建 antiSMASH 环境

conda create -n antiSMASH

# 切换到 antismash 环境中

conda activate antiSMASH

# 然后安装需要的依赖包

conda install -y diamond=0.8.36conda install -y fasttree=2.1.9conda install -y glimmerhmm=3.0.4conda install -y hmmer=2.3.2conda install -y hmmer=3.1b2conda install -y meme=4.11.2conda install -y muscle=3.8.1551conda install -y blast=2.2.31conda install -y prodigal=2.6.3conda install -y java-jdkconda install -y pythonconda install hmmer2

# 外部的一些依赖包安装好以后,接下来是下载 antismash

wget https://dl.secondarymetabolites.org/releases/5.1.2/antismash-5.1.2.tar.gztar -zxf antismash-5.1.2.tar.gzpip install ./antismash-5.1.2

# 在运行“pip install ./antismash-5.1.2”时,如果出现如下报错:

pip._vendor. urllib3. exceptions. Read Time out Error: HTTPS Connection Pool (host='files. pythonhosted.org', port=443): Read timed out.

大概率是由于网速过慢引起的,重新运行一遍“pip install ./antismash-5.1.2“即可

# 这里就完成了 antismash 的本地安装,接下来是下载需要的数据库

download-antismash-databases

# 若出现如下报错

Import Error: "Bio.Alphabet" has been removed from Biopython. In many cases, the alphabet can simply be ignored and removed from scripts. In a few cases, you may need to specify the "molecule_type" as an annotation on a SeqRecord for your script to work correctly. Please see https://biopython.org/wiki/Alphabet for more information."

# 说明是 Biopython 1.78 版本过高,需要使用较低版本

# 因此首先卸载当前版本的 Biopython

pip3 uninstall biopython

# 安装 Biopython 1.77

pip3 install biopython==1.77

# 安装完成后,重新下载需要的数据库

download-antismash-databases

# 得到以下的结果则说明数据库下载并且配置成功

Creating check sum of Pfam-A.hmm

PFAM file present and ok for version 27.0

Downloading PFAM version 31.0

Creating check sum of Pfam-A.hmm.gz

Creating check sum of Pfam-A.hmm.gz

Extraction of Pfam-A.hmm.gz finished successfully.

Resfams database present and checked

Creating check sum of proteins.fasta

Cluster Blast fasta file present and checked

Pre-building all databases...

done.

# 验证 antismash 软件是否安装成功

antismash --check-prereqs

# 当出现以下输出结果则表示 antismash 安装成功!

All prerequisites satisfied

# 查看 antismash 帮助文档:

antismash -h

# 下面对主要参数进行介绍

-h, --help   帮助文档。

--help-showall   在此帮助文本中显示完整的参数。

-cCPUS, --cpus CPUS   设置并行使用 cpu 数量(默认是 12 个)。

基础分析选项:

--taxon {bacteria, fungi}   选择物种类型(分为 bacteria 和 fungi,默认是 bacteria)。

附加分析选项:

--fullhmmer   进行全基因组的 HMMER 分析,寻找 BGCs 中 domains 出现过于频繁的基因组区域。这样能找到一些 clusterblast 步骤中漏掉的基因簇。

--cassis   基于 Motif 的 BGCs 区域预测,仅用于对真菌基因组进行分析。

--cf-borders-only   只注释现有基因簇的边界。

--cf-create-clusters   发现并寻找新的基因簇。

--clusterhmmer   仅对 BGCs 进行 HMMer 分析。

--smcog-trees   对 BGCs 进行分析并归类为不同的家族,并使用该家族的基因(最多 100 个)构建系统发育树。

--tta-thresholdTTA_THRESHOLD   用于注释 TTA 密码子的最低 GC 含量(默认值:0.65)

--cb-general   将预测的 BGCs 与 antiSMASH 预测的 BGCs 数据库进行比较。

--cb-subclusters   将预测的 BGCs 与已知负责合成次级代谢产物前体的亚簇进行比较。

--cb-knownclusters   将预测的 BGCs 与 MIBiG 数据库中已鉴定的 BGCs 进行比较。

--asf   对活性位点进行预测分析。

--pfam2go   利用 Pfam 对 BGCs 中的模块功能进行预测。

输出参数:

--output-dirOUTPUT_DIR   输出文件夹。

--html-titleHTML_TITLE   自定义 HTML 输出页面的标题(默认为输入文件名)。

--html-descriptionHTML_DESCRIPTION   将自定义描述添加到输出结果中。

基因查找选项(注释 ORF 时忽略):

--genefinding-tool {glimmerhmm, prodigal, prodigal-m, none, error}   指定用于基因发现的算法:GlimmerHMM,Prodigal,Prodigal Metagenomic /Anonymous 模式或无。如果尝试基因发现,运行“error”选项将引起报错。运行“none”选项将不会运行基因查找(默认值:error)。

--genefinding-gff3GFF3_FILE   从指定 GFF3 文件中提取特征。

# 从 NCBI 数据库中下载 Genbank 文件。

# 进入 Genbank 文件所在文件夹,以桌面为例。

cd /home/lhc/Desktop

# 设置参数,运行 antiSMASH 对基因组进行分析

antismash --taxon 'bacteria' --fullhmmer --cf-create-clusters --clusterhmmer --cb-general --cb-knownclusters --cb-subclusters --asf --pfam2go --smcog-trees streptomyces_coelicolor.gbk

# 结果文件保存于 streptomyces_coelicolor 文件夹中。点击 index.html 查看预测结果。

------我是分割线------

参考教程:

1:Bioconda 安装与使用

https://www.jianshu.com/p/a20bb8c0bc5c

2:antismash 安装教程

http://blog.sciencenet.cn/blog-3416913-1240614.html

------我是分割线------推荐阅读1:天然产物生物合成常用生信工具------我是分割线------

觉得有用,请点在看

5.1 上网本安装安卓x86_生信工具 | antiSMASH 安装教程相关推荐

  1. 免费Linux系统和生信宝典原创学习教程

    生物信息的学习离不开Linux系统,不管自己写命令处理数据,还是使用现有的工具.Linux对我们来讲最重要的是它强大的命令行功能,可以快速.批量.灵活的处理数据的提取.统计和整理等耗时耗力的重复性工作 ...

  2. VMware虚拟机安装安卓(Android)x86系统图文教程最新版

    来源:合肥电脑维修作者:老刘 在电脑上安装的安卓系统称为"(Android)x86",下载地址为:http://www.android-x86.org/download/,目前最新 ...

  3. web平台安装程序_Galaxy 生信平台(一):安装

    Galaxy Project(https://galaxyproject.org/)是在云计算背景下诞生的一个生物信息学可视化分析开源项目. 该项目由美国国家科学基金会(NSF).美国国家人类基因组研 ...

  4. cplex安装_Excel软件规划求解工具的安装与功能介绍

    引言 规划求解工具是Excel软件中自带的一个功能非常强大的加载项/工具.它能够完成包括线性规划.整数线性规划等一般规模的数学优化问题的问题求解.更重要的是,无论是在Windows操作系统下,还是苹果 ...

  5. 计算机远程安装win7,初试使用Ghost工具远程安装win7操作系统

    一.场景概况 最近统计我国网民超9亿人,随着电脑使用年限的增加,电脑C盘会有越来越多的垃圾文件,使电脑变得卡顿.这个时候得考虑是否需要重装操作系统了. 在很多用户不会安装操作系统的情况下,需要远程协助 ...

  6. Windows服务安装卸载 Windows清理实用工具 SQL2000安装挂起修复工具绿色版

    Windows服务安装卸载 WindowsInstaller清理实用工具(中文版) SQL2000安装挂起修复工具绿色版 WindowsInstaller清理实用工具(中文版)密码: [color=r ...

  7. linux下安装java编译器,编译器构造工具:安装 JFlex 和 CUP - 具 - 精华区 - 优秀的Free OS(Linux)版 - 北大未名BBS...

    发信人: chenhao (阅读文献), 信区: Linux 标  题: 编译器构造工具:安装 JFlex 和 CUP - 具体化的指南 发信站: 北大未名站 (2000年12月06日00:27:52 ...

  8. 5.1 上网本安装安卓x86_电脑装安卓系统,安卓 X86 版 5.1 RC1 下载

    日前,谷歌放出了Android-x86 5.1的第一个候选版本Android-x86 5.1 RC1,该版本基于Android 5.1.1 r24 Lollipop开发,更新包括大量x86(32位)代 ...

  9. samtools merge_【生信工具】Samtools 安装与使用 | “十年以后,工具难免沦为朋友”...

    1.Description | 简介 http://samtools.sourceforge.net/ http://samtools.sourceforge.net/ 由于二代测序中普遍采取短读长( ...

最新文章

  1. C++和python先学哪个
  2. mysql declare 赋值_sql server和mysql变量赋值的区别 以及 MySql Declare(转)
  3. RDA PQ工具使用 (Adi Analysis)
  4. Python3 爬虫学习笔记 C15【代理的基本使用】
  5. Arduino笔记-有源蜂鸣器结合开关(多瑞咪发声)
  6. 电脑怎么远程控制另一台电脑_如何用手机远程控制电脑?
  7. Nginx+keepalive反向代理
  8. 面试题:Java多线程
  9. python自动化测试工程师面试题(转载师傅:上海悠悠)
  10. UI设计和原型设计的区别
  11. 一般纳税人税额计算_一般纳税人税率公式是什么样的,税额是怎么计算的-企业纳税|华律办事直通车...
  12. nes模拟器java怎么用_nes 红白机模拟器 第7篇 编译使用方法
  13. 360周鸿祎:互联网好产品六字法则——刚需、痛点、高频
  14. Microsoft Live Account for Mail, space, onecare
  15. 运动学逆解(四足机器狗)
  16. 树莓派CSI摄像头使用
  17. 支持向量机原理_支持向量机
  18. TYPEC无协议芯片最高可输出5V3A
  19. 数据中台之OneID (ID-Mapping)架构设计细节全解
  20. 轻松去除微博图片logo的方法

热门文章

  1. opencv中的approxPolyDP函数和boundingRect函数
  2. Nautilus启动报错
  3. 【10】青龙面板之JD ck 获取的1种办法
  4. matlab2018无法使用qcat,解决Matlab 2018a源代码的中文支持问题
  5. eclipse写java实现端口_使用eclipse(windows)在java中使用IPv6地址和端口号创建套接字...
  6. mysql数据库限制多次登录失败,限定用户重试时间
  7. 3dmax全局材质灯光细分插件_3Dmax渲染Vray渲染提速优化技巧
  8. Spring框架入门
  9. libevent多线程
  10. java框架知识_java框架知识点总结