使用linux批量引物设计,使用Misa结合Primer3来批量设计SSR引物
MISA,英文全称为MIcroSAtellite identification tool,即微卫星识别工具。
MISA是使用 perl 编写的一支程序,能识别出序列中的微卫星和复合微卫星(两个微卫星之间由由不多于100bp的碱基对隔开),并给出其所在位点。
MISA用法:
$ misa.pl filename
misa.pl
其中,fastfile是序列文件,同时在运行程序的工作目录下必须有一个名称为“misa.ini”
的文件。该文件内容为:
definition(unit_size,min_repeats): 1-10 2-6 3-5 4-5 5-5 6-5
interruptions(max_difference_for_2_SSRs): 100
该文件指定了misa的参数,即1个碱基重复10次及10次以上;2个碱基重复6次及6 次以上;
3个碱基重复5次及5次以上;4个碱基重复5次及5次以上;5个碱基重复5 次及5次以上;6碱
基重复5次及5次以上,这样的碱基重复序列才算是微卫星序列。 同时,两个微卫星之间的距
离小于100bp的时候,两个微卫星组成一个复合微卫星。
MISA的输出结果:
MISA会在 Fastafile 所在的文件夹下生成两个文件,分别是 “.misa” 和 “.statistics”
".misa" :以表格的形式列出微卫星的类型和位点;
".statistics" :统计微卫星的类型和频数。
在MISA的下载页面中,提供了3个附加的 perl 脚本,分别是:Get_est_trimmer.pl,p3_in.pl 和 p3_out.pl。
由于MISA程序读取fasta文件中的序列ID,将序列ID中的空格用下划线 ”_” 填补了,所以在fasta文件中,其序列ID最好不要有空格。否则运行接下来的程序时,会出问题。
Get_est_trimmer.pl
针对EST序列,可以除去EST序列中短的序列和两端不明确的碱基。
p3_in.pl
输入 misa.pl 的输出结果,将引物设计的参数文件(模板,产物长度,目标区域等)导入到一个以“p3in”为后缀的文件中。
$ p3_in.pl filename.misa
调用 primer3_core
该软件详细解说见:http://www.hzaumycology.com/chenlianfu_blog/?p=284,生成结果文件 filename.p3in。使用primer3-2.3.5版本的时候,MISA官网提供的p3_in.pl的结果不符合primer3-2.3.5的输入格式,故需要修改p3_in.pl和p3_out.pl文件。
$ primer3_core -default_version=1 -output=filename.p3out filename.p3in
p3_out.pl
对primer3产生的文件进行提取合,得到最后的结果文件 filename.result
$ p3_out.pl filename.p3out filename.misa
p3_in.pl 和 p3_out.pl 这两支程序需要修改才能正常使用。
结果文件示例
ID SSR nr. SSR type SSR size start end FORWARD PRIMER1 (5'-3') Tm(°C) size REVERSE PRIMER1 (5'-3') Tm(°C) size PRODUCT1 size (bp) start (bp) end (bp) FORWARD PRIMER2 (5'-3') Tm(°C) size REVERSE PRIMER2 (5'-3') Tm(°C) size PRODUCT2 size (bp) start (bp) end (bp) FORWARD PRIMER3 (5'-3') Tm(°C) size REVERSE PRIMER3 (5'-3') Tm(°C) size PRODUCT3 size (bp) start (bp) end (bp)
scaffold1_254817_bp 1 p3 (GCC)5 15 17114 17128 TGATGTCCTAGTGCGTCTCG 60.008 20 CATCCTGTCTTTGAACGGGT 59.966 20 226 17022 17247 TGATGTCCTAGTGCGTCTCG 60.008 20 ACATCCTGTCTTTGAACGGG 59.966 20 227 17022 17248 TGATGTCCTAGTGCGTCTCG 60.008 20 TGAGGGAGTTGTGGTGATGA 60.088 20 142 17022 17163
scaffold1_254817_bp 2 p1 (T)10 10 116694 116703 ATTGCAACCACCAAAGAAGG 59.971 20 CTCCAGGCGCTACGTTAATC 59.867 20 151 116600 116750 TCCCTACTGCATTGACCTCC 60.073 20 CTCCAGGCGCTACGTTAATC 59.867 20 223 116528 116750 ACACTGCCTTCGATTCATCC 60.081 20 CTCCAGGCGCTACGTTAATC 59.867 20 246 116505 116750
scaffold1_254817_bp 3 p3 (TTG)5 15 142162 142176 TCCACAACCCAATTTACGGT 60.088 20 CCAGAGTATGCCTGGTTCGT 60.134 20 212 142004 142215 GTCCACAACCCAATTTACGG 60.088 20 CCAGAGTATGCCTGGTTCGT 60.134 20 213 142003 142215 GCCAGTTTTGACAGGCGTAT 60.140 20 CCAGAGTATGCCTGGTTCGT 60.134 20 236 141980 142215
scaffold1_254817_bp 4 p3 (AGG)5 15 145861 145875 TTCGAGCTCGTCTGGTAGGT 60.012 20 ATTTATCGTCCAGTGCCCAG 59.955 20 212 145725 145936 GTTCGAGCTCGTCTGGTAGG 60.012 20 ATTTATCGTCCAGTGCCCAG 59.955 20 213 145724 145936 GGTTCGAGCTCGTCTGGTAG 60.012 20 ATTTATCGTCCAGTGCCCAG 59.955 20 214 145723 145936
scaffold1_254817_bp 5 p3 (CAT)6 18 182964 182981 TGTAGAGGGAGGCTGAGGAA 59.943 20 TTGCGAAAAGCAAGGAGAGT 60.132 20 270 182913 183182 TGTAGAGGGAGGCTGAGGAA 59.943 20 GCAAGGAGAGTCGGGTATGA 60.218 20 261 182913 183173 TGTAGAGGGAGGCTGAGGAA 59.943 20 AAAAGCAAGGAGAGTCGGGT 60.247 20 265 182913 183177
scaffold1_254817_bp 6 p3 (GAT)5 15 220964 220978 ATTGATACCGGTGGGTGAAA 60.051 20 TTGAAGGAACTTCGAATGGG 60.044 20 263 220929 221191 ATTGATACCGGTGGGTGAAA 60.051 20 TCGAATGGGATCAACTTTCC 59.871 20 252 220929 221180 ATTGATACCGGTGGGTGAAA 60.051 20 GGAACTTCGAATGGGATCAA 59.871 20 258 220929 221186
scaffold1_254817_bp 7 p2 (TA)7 14 249504 249517 TACCATGAGAAGGGGGAATG 59.744 20 TTTTCTCGACACGTCTGCAC 60.032 20 230 249469 249698 AGAAGGGGGAATGCAAAGTC 60.443 20 TTTTCTCGACACGTCTGCAC 60.032 20 223 249476 249698 GAGAAGGGGGAATGCAAAGT 60.443 20 TTTTCTCGACACGTCTGCAC 60.032 20 224 249475 249698
scaffold2_167145_bp 1 p3 (CTG)7 21 3622 3642 GGAGATATTTCCTCAGGGGC 59.866 20 AGGCAATGTCGATGCTATCC 60.066 20 240 3445 3684 AGAAGCAGAAGGAGGTGCAG 59.745 20 AGGCAATGTCGATGCTATCC 60.066 20 184 3501 3684 GGGAGATATTTCCTCAGGGG 59.722 20 AGGCAATGTCGATGCTATCC 60.066 20 241 3444 3684
scaffold2_167145_bp 2 p2 (AT)6 12 82759 82770 CCATCCCTCTTCCTCTTCCT 59.630 20 ACAAGGTGATGCACAATCCA 59.967 20 222 82648 82869 CCATCCCTCTTCCTCTTCCT 59.630 20 CACAAGGTGATGCACAATCC 59.967 20 223 82648 82870 CCATCCCTCTTCCTCTTCCT 59.630 20 CCACAAGGTGATGCACAATC 59.967 20 224 82648 82871
scaffold3_156598_bp 1 c (GGA)5(GGT)5 30 70534 70563 GGTGGATGTATTGGATTGCC 60.021 20 GGCATGAACGACTTTTTGCT 60.257 20 183 70469 70651 GGGTGGATGTATTGGATTGC 60.021 20 GGCATGAACGACTTTTTGCT 60.257 20 184 70468 70651 TGGTCATCGAGCTGATGGTA 60.225 20 GGCATGAACGACTTTTTGCT 60.257 20 229 70423 70651
scaffold3_156598_bp 2 p3 (CGC)6 18 80301 80318 CCGAAAAGGCCATTAGTTCA 60.067 20 ACGACGAATGAAACCCTTTG 59.971 20 255 80206 80460 CCGAAAAGGCCATTAGTTCA 60.067 20 TTGGGGTGAGTTCCTTATCG 59.926 20 238 80206 80443 TCTTTTGACTTCGATGCCCT 59.813 20 ACGACGAATGAAACCCTTTG 59.971 20 216 80245 80460
使用linux批量引物设计,使用Misa结合Primer3来批量设计SSR引物相关推荐
- Linux中使用ps、awk、sh一起批量杀死所有的dotnet进程。
一.操作 Linux中使用ps.awk.sh一起批量杀死所有的dotnet进程. 二.参考命令 ps -ef|grep dotnet|awk 'NR==2{print "kill " ...
- Linux USB设备驱动程序设计 和 USB下载线驱动设计
Linux USB设备驱动程序设计 和 USB下载线驱动设计 USB设备驱动模型 USB设备包括配置(configuration).接口(interface)和端点(endpoint),一个USB设备 ...
- linux局域网语音通讯软件下载,基于Linux平台的局域网可语音的IM软件的设计与实现.doc...
基于Linux平台的局域网可语音的IM软件的设计与实 作者: 专业:软件工程 指导老师: 摘要 随着计算机网络的日益普及人们通过网络进行交流显得越来越重要.于是出现了一系列的通信软件. 自1990s ...
- PXE高效批量安装和Kickstart无人值守安装——真正完成批量自动安装
PXE高效批量安装和Kickstart无人值守安装--真正完成批量自动安装 一.PXE概述 二.PXE的优点 三.搭建PXE的前提 四.部署PXE远程安装服务 1.安装TFTP服务 2.修改TFTP服 ...
- zemax设计35mm镜头_1650万像素的手机镜头设计
1650万像素的手机镜头设计 Yuke Ma, V. N. Borovytsky 摘要: 设计了一款1650万像素的手机镜头.该镜头由3个塑料非球面透镜.一个玻璃球面透镜和一个红外玻璃滤光片组成.使用 ...
- 华中科技大学计算机课程设计,华中科技大学计算机学院操作系统课程设计资料报告材料[1].doc...
<华中科技大学计算机学院操作系统课程设计资料报告材料[1].doc>由会员分享,提供在线免费全文阅读可下载,此文档格式为doc,更多相关<华中科技大学计算机学院操作系统课程设计资料报 ...
- 如果由你来设计 12306.cn,你会怎么设计?
作者:huangkun 链接:https://www.zhihu.com/question/20017917/answer/15272038 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权, ...
- 设计行业高效办公秘籍——趁手的设计软件
现代竞争越来越激烈,越来越多的办公族在工作之余去提升自己,尤其是设计师,希望能提高自己的设计竞争力,提升工作效率.其实设计效率的提升,一方面是需要扩充能力,另一方面,选好高效办公软件对办公效率的提升也 ...
- MVC 网上体育商城的设计与实现java jsp 程序设计 课程设计 毕业设计-附源码02137
因上传问题 只上传了文案 图片未上传 网上体育商城的设计与实现 摘 要 如今我们生活在一个互联网时代,随着智能手机与网络技术的日益发达,电子商务空前发展,许多商品的销售也逐渐从有形的市场转向虚拟的 ...
- 薪酬体系怎么设计?详解HR薪酬体系设计的方法、步骤与工具
HR在定薪时总会遇到这样的情况: 好不容易找到心仪的候选人,顺利走完面试,最后却因为薪资没有别家吸引力拒掉offer. 老员工吐槽,为什么做这么多事,不如新员工拿的多,涨薪还无望? 老板在会上质疑,为 ...
最新文章
- Latex中数学公式中常用符号(持续更新)
- java销售_销售转向java编程的开始之路
- linux中redis的主从
- Django视图(二)
- 零基础学python尹会生_编程零基础应当如何开始学习 Python?
- [转]OpenGL超级宝典 5e 环境配置
- idea关闭当前项目
- java 允许魔术变量_PHP超级全局变量、魔术变量和魔术函数汇总整理
- numpy与matplotlib的学习报告
- Android 投屏集成记录
- 关于CSDN如何搜索用户以及关注好友
- 量化投资学习——资产组合理论(Portfolio Theory)
- instant java,java.time.Instant.compareTo()方法
- 数据一致性、准确性、完整性、及时性、有效性
- AI计算机视觉产品中长尾用户,基于长尾理论的AI写作具体分析
- Linux的ssh学习与配置(SSH的登录)
- 破解长虹电视不能安装u盘app,快速安装第三方软件
- Java题目汇总(二)
- linux tar的排除,Tar命令排除指定目录(常用Linux命令整理)
- Maven虐我千百遍,我待Maven如初恋!
热门文章
- Android技术分享| 【你画我猜】Android 快速实现
- 工业中常见的有塑胶模、五金冲压模、压铸模、吹塑模、挤塑模
- 从VGG19中任意层提取图像识别的特征
- java null转string_java null强转string
- stm32与计算机串口通信,STM32串口通信协议
- python异步编程 图书_Python异步编程介绍
- HTML教程(完整版).pdf,HTML教程详解(完整版).pdf
- MT9 二维数组打印(Python)
- 数据标注工具CVAT教程
- 软件需求分析是什么?