转载:http://fhqdddddd.blog.163.com/blog/static/18699154201241014835362/

http://blog.sina.com.cn/s/blog_4476400f0100iq0x.html

EST----
对EST序列进行冗余查找,利用CD_HIT软件聚类,快速批量去除冗余序列
est-trimer(去掉帽子和尾巴,去掉太短而不可信的)
RepeatMaster(去掉转座子等重复)
seqclean(去除载体,线粒体叶绿体等序列)
CAP3(拼接)
est-trimmer可以从 http://pgrc.ipk-gatersleben.de/misa/do- wnload/est_trimmer.pl 下载,就是个perl脚本,不用安装。脚本运行参数:
DESCRIPTION: Tool for trimming EST (DNA) sequences
## 
## SYNTAX:   est_trimmer.pl <FASTAfile> [-amb=n,win] [-tr5=(A|C|G|T),n,win]
##                          [-tr3=(A|C|G|T),n,win] [-cut=min,max] [-id=name]
##                          [-help]
## 
##    <FASTAfile>    Single file in FASTA format containing the sequence(s).
##    [-amb=n,win]   Removes distal stretches containing "n" ambiguous bases in
a
##                   "win" bp sized window.
##    [-tr5=N,n,win] Removes stretches of the given type N={A,C,G,T} from the 5
'
##                   end. Value "n" defines the min. accepted repeat number of 
"N"
##                   in a 5' window of the size "win".
##    [-tr3=N,n,win] according to [-tr5] for the 3' end.
##    [-cut=min,max] Sets min. value for cutoff and max. sequence size.
##    [-id=name]     Optional. Final results are stored in "name".results, wher
eas
##                   processing steps are listed in "name".log. If not used,
##                   extensions are appended to <FASTAfile>.
##    [-help]        Further descriptions. Use "EST_trimmer.pl -help".
## 
##    Arguments can be used plurally and are processed according to their order
.
## 
## EXAMPLE:  est_trimmer.pl ESTs -amb=2,50 -tr5=T,5,50 -tr3=A,5,50 -cut=100,700
## ____________________________________________________________________________
___
## 

个人觉得-amb 太恐怖了,还是没有,-cut 删除了太多了 将700设定到最大,我是设定到10000。
我的命令:
perl est_trimmer.pl input  -tr5=T,5,50 -tr3=A,5,50 -cut=100,10000 -id=output
 
 

repeatmasker 下载地址:http://repeatmasker.org/RMDownload.html

repeatmasker 是个比较复杂的软件,参数比较多,此外还必须在本机装过crossmatch或者wu-blast要多看手册根据自己实际情况设定。其软件有个数据库,每年都更新,本地计算的必须要注意。
此外 repeatmasker运行真是慢,最好可以设成几个CPU一起算。
我的命令 repeatmasker input -e crossmatch -s
seqclean (下载:http://compbio.dfci.harvard.edu/tgi/software/)
我倒是没遇到参数的问题,就是得在NCBI上下载下载体序列ftp://ftp.ncbi.nih.gov/pub/UniVec/ 里面还有个core的,和全的,我的数据反正算的快,就选了比较大的那个文件,将univec用formatdb命令格式化下就可以直接用了
我的命令
 /usr/biosoft/blast-2.2.18/bin/formatdb -i UniVec -p F -o T
 /usr/biosoft/seqclean/seqclean BnE091007.fasta -v UniVec -o BnE_clean.fasta
 
当是我因为程序的权限不够,怎么都用不了。后来用chmod把seqclean程序的文件夹的东西都改了才行。还好最后终于成功了

转载于:https://www.cnblogs.com/renping/p/7465267.html

38、EST序列拼接流程相关推荐

  1. linux序列拼接软件,EST序列的聚类、拼接以及纠错是怎样进行的,推荐使用那些软件?!...

    各位大神们,我是一个刚刚开始进行生物信息分析实验的本科生,我需要做一个宁夏枸杞ACS基因的电子克隆,但是貌似NCBI的数据库里没有我需要的EST序列,所以只能采用同科的番茄来进行电子克隆. 但是刚刚开 ...

  2. 高通量测序技术和序列拼接算法探析

    高通量测序技术和序列拼接算法探析 时间:2019-05-27 来源:计算机科学 作者:周卫星,石海鹤 本文字数:16853字 摘    要: 高通量测序 (High-throughput Sequen ...

  3. linux序列拼接软件,批量序列拼接工具:CAP3/PCAP下载

    1,在线的CAP3,少量的序列拼接 这里提供一些EST序列,用于拼接的测试.完了后生成几个文件.有两个说一下,有一个是".qual"文件, 另一下是".con/.cont ...

  4. Pr 多机位序列的流程

    Pr 多机位序列的流程 一.什么是多机位呢? 多机位拍摄就是同时使用多台摄像机从不同角度和远近进行拍摄的一种方式. 二.多机位操作流程 1.(1)我们使用一段视频来新建一个序列,然后将其他视频段拖到V ...

  5. 序列拼接工具Bowtie使用说明

    序列拼接工具Bowtie使用说明 2011-06-08 ~ ADMIN Bowtie是一个超级快速的,较为节省内存的短序列拼接至模板基因组的工具.它在拼接35碱基长度的序列时,可以达到每小时2.5亿次 ...

  6. 基于平面标靶的faro点云拼接流程(全站仪或RTK)

    基于平面标靶的faro点云拼接流程(全站仪或RTK) 一.主扫描站不布置标靶情况: 1.导入标靶坐标 2.提取主站点标靶 3.利用标靶,使用"基于目标"的拼接方式拼接主站点 固定除 ...

  7. 生信漫谈送你超级好用的多序列拼接软件

    作为科研人员(生物专业从业者,医学生,临床医生等),接触的各种测序非常多,那么怎么快速的分析你测序的结果呢,测了正向,测了反向序列,是不是测通了,只有拼接在一起才知道,科研真是费脑 https://m ...

  8. 二三代基因组混合组装流程的搭建与序列拼接并行优化方法研究_武海波

    当今世纪,生物学技术得到了迅速发展,世界己经进入了信息科学的时代和生命 科学的时代.与此同时,超级计算机的发展.集群的广泛应用.国际互联网的飞速发 展为分子生物学的研究提供了强有力的支撑.为了更加有效 ...

  9. 基于WGS和CBC测序策略的DNA序列拼接算法研究(六)

    4.3.1  程序的结构 Atlas-prep-read 1.create index file atlas-createindex</perl/bin >(perl程序) 2.split ...

最新文章

  1. 怎么用python找因子_在python中有大量因子
  2. tfs 点获取最新,如果检查到大量冲突
  3. linux添加root级别账户
  4. JVM - 常见的JVM种类
  5. python链家网高并发异步爬虫asyncio+aiohttp+aiomysql异步存入数据
  6. 一名游戏开发者的告白
  7. 第二周web作业1:简单的注册表单
  8. windows 服务部署管理
  9. IronPython资料
  10. CentOS 7 利用Docker搭建Showdoc文档管理系统
  11. 加权回归估计_比率估计与回归估计
  12. Tortoise svn 基础知识
  13. 新版PMP考试解题技巧有哪些?总结在这里
  14. 转移Package Cache文件夹,转移Windows Installer文件夹
  15. android 支付宝登录界面,模仿支付宝登录页的实现(android)
  16. 英语听力计算机教室,每日英语听力电脑版|每日英语听力 v9.2.0 PC客户端
  17. 看看中国科技巨头们在智能音箱行业的竞争
  18. 国外服务器 虚拟主机,虚拟主机国内国外什么区别
  19. C++检测键盘大小写
  20. 硬币翻转倍数递增试算

热门文章

  1. iOS 客户端与服务端做时间同步
  2. 如何在没有联网的情况下使用maven本地仓库进行开发
  3. 中国数字标牌行业市场供需与战略研究报告
  4. 综合工具-DesignCompiler学习教程
  5. 为什么大家都想进入IT行业?IT行业到底好不好?
  6. 实力赢得信任丨西安珠江新城业主喜迎公元物业
  7. 解决No “rule to make target `../skin_test.qss', needed by `debug/qrc_resource.cpp'. Stop.”
  8. 美国诚实签经验——不要插队
  9. 安卓海豚wii模拟器_dolphin模拟器安卓版
  10. (戒急用忍)本来是要展望2019的,没想到重点不由自主的写成了回顾前几年的事情了