EMBOSS的安装以及使用
EMBOSS 是欧洲分子生物学开放软件包,主要做序列比对,数据库搜搜,蛋白模块 分析和功能域分析,序列模式搜索,
引物设计等。
一些常见的应用。具体使用及功能可以参照http://emboss.sourceforge.net/apps/
或者在/EMBOSS-6.6.0/emboss路径下,输入./prophet --h 查看(仅仅输入prophet --h 会提示The program 'prophet' is currently not installed. To run 'prophet' please ask your administrator to install the package 'emboss' )
prophet Gapped alignment for profiles.
infoseq Displays some simple information about sequences.
water Smith-Waterman local alignment.
pepstats Protein statistics.
showfeat Show features of a sequence.
palindrome Looks for inverted repeats in a nucleotide sequence.
eprimer3 Picks PCR primers and hybridization oligos.
profit Scan a sequence or database with a matrix or profile.
extractseq Extract regions from a sequence.
marscan Finds MAR/SAR sites in nucleic sequences.
tfscan Scans DNA sequences for transcription factors.
patmatmotifs Compares a protein sequence to the PROSITE motif database.
showdb Displays information on the currently available databases.
wossname Finds programs by keywords in their one-line documentation.
abiview Reads ABI file and display the trace.
tranalign Align nucleic coding regions given the aligned proteins.
源码安装EMBOSS, 下载地址ftp://emboss.open-bio.org/pub/EMBOSS/emboss-latest.tar.gz.
参照http://emboss.sourceforge.net/download/
1.解压到目录
2.执行命令 ./configure 生成Makefile文件(./configure --prefix=/home/ct/soft/specific_name(不在指定目录时添加))
3.make
4.make install(可无)
5.测试是否编译成功
进入安装目录下的emboss路径,将测试输入文件复制到自己定义的一个目录
# 仅仅是安装完emboss,(可以把bin文件添加到系统环境变量中)做引物方面的分析还是不行,还需要安装个primer3,链接:http://primer3.sourceforge.net/
安装步骤:/software$运行以下命令
url=https://sourceforge.net/projects/primer3/files/primer3/2.3.7/
wget ${url}primer3-2.3.7.tar.gz -O primer3-2.3.7.tar.gz
tar xvzf primer3-2.3.7.tar.gz
cd primer3-2.3.7/src
make all
#确保~/bin在环境变量中
ln -s `pwd`/primer3_core ~/bin/primer32_core(在bin中创建一个软链接)
以上步骤运行完成后,运行eprimer32 -sequence test.fa -outfile test.fa.primer \
-targetregion 0,371 -optsize 20 -numreturn 3 \
-minsize 15 -maxsize 25 \
-opttm 50 -mintm 45 -maxtm 55 \
-psizeopt 200 -prange 100-280
会提示targetregion 0,371有问题,由于目前没有找到原因,所以就运行最简单的命令,eprimer32 -sequence test.fa -outfile test.fa.primer
这时会提示Error: thermodynamic approach chosen, but path to thermodynamic parameters not specified错误。
解决方案:
一:输入命令时加入-default_version=1的参数(发现还是不行)
发现Primer3文档中有这样的改变:
“2.5. IMPORTANT: because PRIMER_THERMODYNAMIC_OLIGO_ALIGNMENT=1,PRIMER_THERMODYNAMIC_PARAMETERS_PATH must point to the right location.This tag specifies the path to the directory that contains all theparameter files used by the thermodynamic approach. In Linux, thereare two *default* locations that are tested if this tag is notdefined: ./primer3_config/ and /opt/primer3_config/. For Windows,there is only one default location: .primer3_config. If the theparameter files are not in one these locations, be sure to setPRIMER_THERMODYNAMIC_PARAMETERS_PATH.”
二 sudo mkdir /opt/primer3_config
sudo cp -R primer3-2.3.7/src/primer3_config/* /opt/primer3_config
以上所有操作完成后才是完整的。
测试:
测试数据(自己创建一个test.fa文件)
cat <<END >test.fa
>comp24_c0_seq1
TTACTCTCATCCTCCCCTTGTTGAAAGATTGGCTGCAATTGATGAACCCGATAAGAAGGTCAACTAAGAGAAGTGTAC
TTTTACGCATGGCATGGCATGGCGAGATATGGCTGTAATATGAGTATTATTTTCCTATGTTGCTACCGATATTTTCTA
TTTGCATATGAAAATTCCAAACCCAGAGTTAGGGGCCATATCTAAAGGGAATTTGCTAACGAGTAAATGGGAAAATAG
GAAATGTCAGAGGAGAtagcctagcctagcctagcctagccTCGCCTCATGTAACGAAATACAATTTAAATTTTGCTT
TACAGCTAATAGTCAGACTTTACATTTTGCTAAAA
END
①设计引物
eprimer32 -sequence test.fa -outfile test.fa.primer
引物结果:
②整理引物格式位PrimerSearch 需要的格式
awk '{if($0~/EPRIMER32/) {seq_name=$5;count=1;} else \
if($0~/FORWARD PRIMER/) forward=$7; else if ($0~/REVERSE PRIMER/) \
{reverse=$7; printf("%s@%d\t%s\t%s\n", seq_name,count,forward, reverse); \
count+=1;} }' test.fa.primer >all_primer_file
结果:
comp24_c0_seq1@1 GCATGGCATGGCGAGATATG CGTTACATGAGGCGAGGCTA
comp24_c0_seq1@2 TTTACGCATGGCATGGCATG CGTTACATGAGGCGAGGCTA
comp24_c0_seq1@3 GCATGGCATGGCGAGATATG TTCGTTACATGAGGCGAGGC
comp24_c0_seq1@4 ATGGCATGGCGAGATATGGC CGTTACATGAGGCGAGGCTA
comp24_c0_seq1@5 GGCATGGCATGGCGAGATAT CGTTACATGAGGCGAGGCTA
③模拟PCR
primersearch -seqall test.fa -infile all_primer_file -mismatchpercent 5 -outfile test.database.primerSearch
结果:
needleall 的使用
needleall 读入两个文件,第一个文件的每个序列都与第二个文件的每个序列进行全局比对,采用Needleman-Wunsch
算法。
#随机生成测试数据
cat <<END >generateRandom.awk
BEGIN{srand(seed); seq[0]="A"; seq[1]="C"; seq[2]="G"; seq[3]="T"}
{for(i=1;i<=chrNum;i++)
{print ">"label""i; len=(10-int(rand()*10)%2)/10*expected_len;
for(j=0;j<=len;j++) printf("%s", seq[int(rand()*10)%4]); print "";
}
}
END
echo 1 | awk -v seed=$RANDOM -v label=mm -v chrNum=2 -v expected_len=40 -f generateRandom.awk >test1.fa
echo 1 | awk -v seed=$RANDOM -v label=hs -v chrNum=2 -v expected_len=40 -f generateRandom.awk >test2.fa
needleall -asequence test1.fa -bsequence test2.fa -gapopen 10 -gapextend 0.5 -outfile test12.needle.alignment -auto -aformat3 pair
结果:
needleall -asequence test1.fa -bsequence test2.fa -gapopen 10 -gapextend 0.5 -outfile test12.needle.score -auto
结果:
mm1 hs1 58 (20.5)
mm2 hs1 57 (32.0)
mm1 hs2 49 (31.5)
mm2 hs2 47 (31.0)
在绝对路径下执行命令./needleall -asequence ../test.fa -bsequence ../test.fa -auto -aformat3 pair -sprotein1 1 -sprotein2 1 -outfile out.aln
EMBOSS的安装以及使用相关推荐
- 视频 | EMBOSS软件包安装和使用(序列提取、引物设计)
点击阅读原文跳转完整教案. 基因组中的趣事(二)- 最长的基因2.7 million,最短的基因只有8 nt却能编码 基因组中的趣事(一):这个基因编码98种转录本 1 Linux初探,打开新世界的大 ...
- emboss 安装使用
emboss 安装使用 Emboss(The European Molecular Biology Open Software Suite)该软件包源于1988年开始开发的EGCG系统,是一个开放源代 ...
- biopython安装_BioPython的安装和使用
BioPython 是一个用来处理序列和生物信息的python包,里面包含了很多的工具,可以用来直接读取fasta格式.安装可以通过两种方式,pip方式: 1. pip 方式 pip3 install ...
- oracle euk 什么系统,【T】每日一生信--interproscan安装及使用(终结版)
本博文已整理到新地址:http://qinqianshan.com/interproscan-installation-and-usage/ Interpro是一个数据库,它里面有蛋白功能,蛋白家族等 ...
- CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念)、早期/中期/近期应用领域(偏具体应用)、经典CNN架构(偏具体算法)概述、常用工具/库/框架/产品、环境安装、常用数据集、编程技巧
CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念).早期/中期/近期应用领域(偏具体应用).经典CNN架构(偏具体算法)概述.常用工具/库/框架/产品.环境安装.常用数据集.编程技巧 ...
- Python imgaug库 安装与使用 (图片加模糊光雨雪雾等特效)
imgaug库 简介 安装 Overview 特效 Project 结构 程序 参考的源代码(来源于网络) 简易变换 试效果 使用 模糊光雨雪雾 else 重命名00001.jpg 重命名1.jpg ...
- PhotoShop的字体安装及制作文字特效
我们经常能在书上.网上或招贴画上看到一些很特别的字体,这时我想你一定会为这些特殊的字体而感到心动.其实在PhotoShop中就能很简单的实现这些效果,现在就让我们一起学习PhotoShop的文字特效制 ...
- 安装Bioperl最基本模块Bio::SeqIO
Bioperl就像个大柜子,里面存放各种模块.Bio::SeqIO是Bioperl最基本的模块,本文介绍其在CentOS7-64bit下的安装方法. STEP1:prepare to install ...
- emboss 简单介绍
emboss 简介 Emboss(The European Molecular Biology Open Software Suite)该软件包源于1988年开始开发的EGCG系统,是一个开放源代码的 ...
最新文章
- mysql绿色版的应用5.7
- JZOJ__Day 6:【普及模拟】团队背包(team)
- error2---BeginPath和EndPath之间的TextOut无法显示
- c++输入一个整数判断是否为完全平方数_matlab判断一个整数是完全平方数
- csv导入mysql_mysql导入超大csv指南
- linux上使用ASP
- leetcode 384 打乱数组
- Asp.Net删除文件夹后引起Session丢失的解决办法
- 教你4种压缩PDF让文档快速变小的方法
- 目标客户画像_4 种类型 + 10 大步骤,详解用户画像
- 计算机蓝屏解决,电脑蓝屏怎么解决,详细解决蓝屏方案
- matlab 进行时域分析实验报告,控制系统时域分析实验报告.doc
- 荣耀热键驱动无法安装
- ZOJ Problem 1005 jugs
- 如何保存google的壁纸
- Java 8 之实战篇
- Logisticregression学习
- 深度学习中的without bells and whistles是什么意思?
- RENIX报文字段跳变——网络测试仪实操
- 网络运维基础知识梳理