EMBOSS 是欧洲分子生物学开放软件包,主要做序列比对,数据库搜搜,蛋白模块 分析和功能域分析,序列模式搜索,
引物设计等。

一些常见的应用。具体使用及功能可以参照http://emboss.sourceforge.net/apps/

或者在/EMBOSS-6.6.0/emboss路径下,输入./prophet --h 查看(仅仅输入prophet --h 会提示The program 'prophet' is currently not installed. To run 'prophet' please ask your administrator to install the package 'emboss' )
prophet             Gapped alignment for profiles.
infoseq              Displays some simple information about sequences.
water                 Smith-Waterman local alignment.
pepstats             Protein statistics.
showfeat            Show features of a sequence.
palindrome         Looks for inverted repeats in a nucleotide sequence.
eprimer3             Picks PCR primers and hybridization oligos.
profit                   Scan a sequence or database with a matrix or profile.
extractseq          Extract regions from a sequence.
marscan             Finds MAR/SAR sites in nucleic sequences.
tfscan                 Scans DNA sequences for transcription factors.
patmatmotifs       Compares a protein sequence to the PROSITE motif database.
showdb               Displays information on the currently available databases.
wossname          Finds programs by keywords in their one-line documentation.
abiview                Reads ABI file and display the trace.
tranalign            Align nucleic coding regions given the aligned proteins.

源码安装EMBOSS, 下载地址ftp://emboss.open-bio.org/pub/EMBOSS/emboss-latest.tar.gz.

参照http://emboss.sourceforge.net/download/

1.解压到目录

2.执行命令 ./configure 生成Makefile文件(./configure --prefix=/home/ct/soft/specific_name(不在指定目录时添加))

3.make

4.make install(可无)

5.测试是否编译成功

进入安装目录下的emboss路径,将测试输入文件复制到自己定义的一个目录

# 仅仅是安装完emboss,(可以把bin文件添加到系统环境变量中)做引物方面的分析还是不行,还需要安装个primer3,链接:http://primer3.sourceforge.net/

安装步骤:/software$运行以下命令

url=https://sourceforge.net/projects/primer3/files/primer3/2.3.7/

wget ${url}primer3-2.3.7.tar.gz -O primer3-2.3.7.tar.gz

tar xvzf primer3-2.3.7.tar.gz

cd primer3-2.3.7/src

make all

#确保~/bin在环境变量中

ln -s `pwd`/primer3_core ~/bin/primer32_core(在bin中创建一个软链接)

以上步骤运行完成后,运行eprimer32 -sequence test.fa -outfile test.fa.primer \
-targetregion 0,371 -optsize 20 -numreturn 3 \
-minsize 15 -maxsize 25 \
-opttm 50 -mintm 45 -maxtm 55 \
-psizeopt 200 -prange 100-280

会提示targetregion 0,371有问题,由于目前没有找到原因,所以就运行最简单的命令,eprimer32 -sequence test.fa -outfile test.fa.primer

这时会提示Error: thermodynamic approach chosen, but path to thermodynamic parameters not specified错误。

解决方案:

一:输入命令时加入-default_version=1的参数(发现还是不行)

发现Primer3文档中有这样的改变:

“2.5. IMPORTANT: because PRIMER_THERMODYNAMIC_OLIGO_ALIGNMENT=1,PRIMER_THERMODYNAMIC_PARAMETERS_PATH must point to the right location.This tag specifies the path to the directory that contains all theparameter files used by the thermodynamic approach. In Linux, thereare two *default* locations that are tested if this tag is notdefined: ./primer3_config/ and /opt/primer3_config/. For Windows,there is only one default location: .primer3_config.  If the theparameter files are not in one these locations, be sure to setPRIMER_THERMODYNAMIC_PARAMETERS_PATH.”

二 sudo mkdir /opt/primer3_config

sudo cp -R primer3-2.3.7/src/primer3_config/* /opt/primer3_config

以上所有操作完成后才是完整的。

测试:

测试数据(自己创建一个test.fa文件)

cat <<END >test.fa

>comp24_c0_seq1
TTACTCTCATCCTCCCCTTGTTGAAAGATTGGCTGCAATTGATGAACCCGATAAGAAGGTCAACTAAGAGAAGTGTAC
TTTTACGCATGGCATGGCATGGCGAGATATGGCTGTAATATGAGTATTATTTTCCTATGTTGCTACCGATATTTTCTA

TTTGCATATGAAAATTCCAAACCCAGAGTTAGGGGCCATATCTAAAGGGAATTTGCTAACGAGTAAATGGGAAAATAG
GAAATGTCAGAGGAGAtagcctagcctagcctagcctagccTCGCCTCATGTAACGAAATACAATTTAAATTTTGCTT
TACAGCTAATAGTCAGACTTTACATTTTGCTAAAA
END

①设计引物

eprimer32 -sequence test.fa -outfile test.fa.primer

引物结果:

②整理引物格式位PrimerSearch 需要的格式

awk '{if($0~/EPRIMER32/) {seq_name=$5;count=1;} else \
if($0~/FORWARD PRIMER/) forward=$7; else if ($0~/REVERSE PRIMER/) \
{reverse=$7; printf("%s@%d\t%s\t%s\n", seq_name,count,forward, reverse); \
count+=1;} }' test.fa.primer >all_primer_file

结果:

comp24_c0_seq1@1    GCATGGCATGGCGAGATATG    CGTTACATGAGGCGAGGCTA
comp24_c0_seq1@2    TTTACGCATGGCATGGCATG    CGTTACATGAGGCGAGGCTA
comp24_c0_seq1@3    GCATGGCATGGCGAGATATG    TTCGTTACATGAGGCGAGGC
comp24_c0_seq1@4    ATGGCATGGCGAGATATGGC    CGTTACATGAGGCGAGGCTA
comp24_c0_seq1@5    GGCATGGCATGGCGAGATAT    CGTTACATGAGGCGAGGCTA

③模拟PCR

primersearch -seqall test.fa -infile all_primer_file -mismatchpercent 5 -outfile test.database.primerSearch

结果:

needleall 的使用

needleall 读入两个文件,第一个文件的每个序列都与第二个文件的每个序列进行全局比对,采用Needleman-Wunsch
算法。

#随机生成测试数据

cat <<END >generateRandom.awk
BEGIN{srand(seed); seq[0]="A"; seq[1]="C"; seq[2]="G"; seq[3]="T"}
{for(i=1;i<=chrNum;i++)
{print ">"label""i; len=(10-int(rand()*10)%2)/10*expected_len;
for(j=0;j<=len;j++) printf("%s", seq[int(rand()*10)%4]); print "";
}
}
END

echo 1 | awk -v seed=$RANDOM -v label=mm -v chrNum=2 -v expected_len=40 -f generateRandom.awk >test1.fa

echo 1 | awk -v seed=$RANDOM -v label=hs -v chrNum=2 -v expected_len=40 -f generateRandom.awk >test2.fa

needleall -asequence test1.fa -bsequence test2.fa -gapopen 10 -gapextend 0.5 -outfile test12.needle.alignment -auto -aformat3 pair

结果:

needleall -asequence test1.fa -bsequence test2.fa -gapopen 10 -gapextend 0.5 -outfile test12.needle.score -auto

结果:

mm1 hs1 58 (20.5)
mm2 hs1 57 (32.0)
mm1 hs2 49 (31.5)
mm2 hs2 47 (31.0)

在绝对路径下执行命令./needleall -asequence ../test.fa -bsequence ../test.fa -auto -aformat3 pair -sprotein1 1 -sprotein2 1 -outfile out.aln

EMBOSS的安装以及使用相关推荐

  1. 视频 | EMBOSS软件包安装和使用(序列提取、引物设计)

    点击阅读原文跳转完整教案. 基因组中的趣事(二)- 最长的基因2.7 million,最短的基因只有8 nt却能编码 基因组中的趣事(一):这个基因编码98种转录本 1 Linux初探,打开新世界的大 ...

  2. emboss 安装使用

    emboss 安装使用 Emboss(The European Molecular Biology Open Software Suite)该软件包源于1988年开始开发的EGCG系统,是一个开放源代 ...

  3. biopython安装_BioPython的安装和使用

    BioPython 是一个用来处理序列和生物信息的python包,里面包含了很多的工具,可以用来直接读取fasta格式.安装可以通过两种方式,pip方式: 1. pip 方式 pip3 install ...

  4. oracle euk 什么系统,【T】每日一生信--interproscan安装及使用(终结版)

    本博文已整理到新地址:http://qinqianshan.com/interproscan-installation-and-usage/ Interpro是一个数据库,它里面有蛋白功能,蛋白家族等 ...

  5. CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念)、早期/中期/近期应用领域(偏具体应用)、经典CNN架构(偏具体算法)概述、常用工具/库/框架/产品、环境安装、常用数据集、编程技巧

    CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念).早期/中期/近期应用领域(偏具体应用).经典CNN架构(偏具体算法)概述.常用工具/库/框架/产品.环境安装.常用数据集.编程技巧 ...

  6. Python imgaug库 安装与使用 (图片加模糊光雨雪雾等特效)

    imgaug库 简介 安装 Overview 特效 Project 结构 程序 参考的源代码(来源于网络) 简易变换 试效果 使用 模糊光雨雪雾 else 重命名00001.jpg 重命名1.jpg ...

  7. PhotoShop的字体安装及制作文字特效

    我们经常能在书上.网上或招贴画上看到一些很特别的字体,这时我想你一定会为这些特殊的字体而感到心动.其实在PhotoShop中就能很简单的实现这些效果,现在就让我们一起学习PhotoShop的文字特效制 ...

  8. 安装Bioperl最基本模块Bio::SeqIO

    Bioperl就像个大柜子,里面存放各种模块.Bio::SeqIO是Bioperl最基本的模块,本文介绍其在CentOS7-64bit下的安装方法. STEP1:prepare to install ...

  9. emboss 简单介绍

    emboss 简介 Emboss(The European Molecular Biology Open Software Suite)该软件包源于1988年开始开发的EGCG系统,是一个开放源代码的 ...

最新文章

  1. mysql绿色版的应用5.7
  2. JZOJ__Day 6:【普及模拟】团队背包(team)
  3. error2---BeginPath和EndPath之间的TextOut无法显示
  4. c++输入一个整数判断是否为完全平方数_matlab判断一个整数是完全平方数
  5. csv导入mysql_mysql导入超大csv指南
  6. linux上使用ASP
  7. leetcode 384 打乱数组
  8. Asp.Net删除文件夹后引起Session丢失的解决办法
  9. 教你4种压缩PDF让文档快速变小的方法
  10. 目标客户画像_4 种类型 + 10 大步骤,详解用户画像
  11. 计算机蓝屏解决,电脑蓝屏怎么解决,详细解决蓝屏方案
  12. matlab 进行时域分析实验报告,控制系统时域分析实验报告.doc
  13. 荣耀热键驱动无法安装
  14. ZOJ Problem 1005 jugs
  15. 如何保存google的壁纸
  16. Java 8 之实战篇
  17. Logisticregression学习
  18. 深度学习中的without bells and whistles是什么意思?
  19. RENIX报文字段跳变——网络测试仪实操
  20. 网络运维基础知识梳理

热门文章

  1. Ubuntu18.04 安装 samba 服务器
  2. GCD的一些测试和总结
  3. 【阿旭机器学习实战】【27】贝叶斯模型:新闻分类实战----CounterVecorizer与TfidVectorizer构建特征向量对比
  4. PPP模式或成光伏业的又一切入口
  5. 三个交换机进行连接互通
  6. 什么是ddx 2000字
  7. 键盘监听器————在飞机大战中的利用(移动,加速,发射子弹,一应俱全)
  8. 一、让LCD显示可爱的小企鹅
  9. 蒙特卡洛法模拟计算圆周率π
  10. 【人脸识别系列】face_recognition实现