在生物信息中,基因组共线性分析dotplot图几乎全部是用MUMmer或者LAST做的。相比对LAST,MUMmer生成的图似乎更加美观和详细,last-plot会可能会省略一些过长的id,而mummerplot会全部写出来。

  1. MUMmer的安装

1.1 安装MUMmer主程序前,需要先安装gnuplot:

从gnuplot的官网http://www.gnuplot.info/ 链接到其sourceforge: http://mummer.sourceforge.net/下载页。

注意:最新版的gnuplot v5.2.6在后续运行时与MUMmer4可能不太兼容,会报如下错误:

“sample.gp” line 45: warning: this copy of gnuplot has no mouse support

set mouse format “%.0f” ^

“sample.gp” line 45: unexpected or unrecognized token

WARNING: Unable to run ‘/path/to/gnuplot-5.2.6/bin/gnuplot sample.gp’, Inappropriate ioctl for device

这里下载的稳定的老版本gnuplot v4.6.2,读者也可以尝试其它更高一些的老版本,欢迎将测试结果分享到讨论区。

mkdir gnuplot && cd gnuplot

wget https://sourceforge.net/projects/gnuplot/files/gnuplot/4.6.2/gnuplot-4.6.2.tar.gz

tar -zxvf gnuplot-4.6.2.tar.gz

./configure --prefix=$PWD

make

make install

注意:如果有报错,可以尝试升级gcc版本

完成后,需要将生成的bin目录加到环境变量中

export PATH=/path/to/gnuplot/gnuplot-4.6.2/bin:$PATH

1.2 再来安装mummer:

mkdir MUMmer4.00b2 && cd MUMmer4.00b2

#MUMmer4.00b2是其安装目录

从MUMmer GitHub下载最新版mummer-4.6.2beta2,并安装:

wget https://github.com/mummer4/mummer/releases/download/v4.6.2beta2/mummer-4.6.2beta2.tar.gz

tar -zxvf mummer-4.0.0beta2.tar.gz

cd mummer-4.6.2beta2

./configure --prefix=$PWD

make

make install

mummer套件中其它程序还好,如果最难搞的mummerplot安装完成,就明表明安装OK。可以通过以下结果来验证是否安装完整。

  1. MUMmer的运行

建议将MUMmer的路径写到运行时的shell脚本中,当然也可以一次性写到$HOME/.bashrc中

export PATH=/path/to/MUMmer4.00b2/mummer-4.0.0beta2/bin:$PATH

step1: run nucmer for alignment

nucmer --threads 32 --mum -D 5 -p <outpfix> <subject> <query>

outpfix是输出文件前缀

subject和query是想要比较的两个序列文件,fasta格式

step2: filter alignment result

delta-filter -i 85 -l 8000 -o 85 <outpfix>.delta -1 > <outpfix>.best_delta

其中-i指定最小的alignment相似性阈值

-l,注意,这里是字母小写的L,指定最小的alignment长度

-o 和-r,-q相关,可以理解为alignment coverage

-1注意,这里是数字1,指定是否进行一对一的比对,一个位置(subject或query上)只找一个最佳的比对。特别是对大的基因组一定要加这个选项,否则会异常慢

具体的参数可以通过delta-filter -h参看到

step3: generate figure using mummerplot

mummerplot -p .best_delta -t postscript

采用上一步过滤后的结果.best_delta画图,这里生成的是ps格式的图,虽然-t可以指定png图,但是结果显示生成的png图分辨率太低。

step4: convert ps format to png

/usr/bin/ps2pdf .ps .pdf

convert -density 300 .pdf .png

ps2pdf可以将ps格式的文件转pdf

convert是imagemagick包中的一个子程序,可以将pdf转为png图片,而且清晰度高。

mummer还有一些其他用法。MUMmer是TRIG在1999年开发的,是最早的全局比对软件,因为之前序列都比较短,以局部比对软件为主。mummer的出现,让我们能一次比较不同物种两个完整基因组之间的差别。Mummer使用一种后缀树的算法,其比对速度快,资源消耗小。Mummer里面其实包含了很多分析工具。如基因组比对,共线性分析,同源序列搜索,重复序列查找,SNP和Indel检测等。这些工具搭配起来使用,可以完成非常多的工作。

show-snps 用于显示两样本的snp信息
show-aligns 用于显示比对,可以单独列出每个序列的比对情况。
show-coords 用于显示比对坐标,用于后续共线性分析定制化绘图
show-diff显示大的染色体变化 倍增 重排或者直接使用dnadiff软件一步生成,结果非常详细,还有一个report报告文件
dnadiff可以直接加-d接delta格式的结果(/opt/software/mummer-3.9.4alpha/dnadiff -d <outpfix>.delta),或者更方便直接接两条序列即可,非常方便好用。

mummer基因组共线性分析详解相关推荐

  1. R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据

    R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据 目录

  2. wav文件格式分析详解

    wav文件格式分析详解 作者:曹京 日期:2006年7月17日 一.综述     WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的. RIFF是英文Resource Inte ...

  3. 03-instancing 工程分析详解

    opengl编程指南第8版源码怎么下载.编译,请参考<opengl编程指南第8版源码编译详细说明> 1. 程序启动 请参考<03-drawcommands工程分析详解> 2. ...

  4. Memcache的使用和协议分析详解

    Memcache的使用和协议分析详解 作者:heiyeluren 博客:http://blog.csdn.net/heiyeshuwu 时间:2006-11-12 关键字:PHP Memcache L ...

  5. R语言生存分析详解:KM曲线、COX比例风险模型、HR值解读、模型比较、残差分析、是否比例风险验证:基于survival包lung数据集

    R语言生存分析详解:KM曲线.COX比例风险模型.HR值解读.模型比较.残差分析.是否比例风险验证:基于survival包lung数据集 目录

  6. 【轨话直说】化妆品行业某叶直销行业模式奖金制度分析详解教程

    [轨话直说]专注分析各类直销.分销.新零售等模式的奖金制度.让你更加了解直销模式和奖金制度拨比的秘密和作用.如果你也对直销分销等模式比较感兴趣,可以联系我,一起交流一起学习. [轨话直说]化妆品行业某 ...

  7. SIMPLIS仿真软件4-POP分析详解

    SIMPLIS仿真软件4-POP分析详解 导读 POP分析的工作原理 POP核心进程 仿真时出现的一些常见的错误 导读 本文将对SIMPLIS中的POP分析进行详细的介绍.包括POP的工作原理,仿真时 ...

  8. 线程组ThreadGroup分析详解 多线程中篇(三)

    线程组,顾名思义,就是线程的组,逻辑类似项目组,用于管理项目成员,线程组就是用来管理线程. 每个线程都会有一个线程组,如果没有设置将会有些默认的初始化设置 而在java中线程组则是使用类ThreadG ...

  9. HTTP协议版本介绍以及使用Wireshark工具针对HTTP进行抓包分析详解

    一.http协议版本介绍 http:Hyper Text Transfer Protocol 超文本传输协议,是互联网应用最为广泛的一种网络协议,主要用于Web服务.通过计算机处理文本信息,格式为HT ...

  10. mysql数据类型设计说明_MySQL的数据类型和建库策略分析详解

    MySQL的数据类型和建库策略分析详解 更新时间:2008年04月06日 01:16:47   作者: 无论是在小得可怜的免费数据库空间或是大型电子商务网站,合理的设计表结构.充分利用空间是十分必要的 ...

最新文章

  1. datasg中的数据存储情况
  2. 深入了解jquery中的键盘事件
  3. 你的设备中缺少重要的安全和质量修复_城市排水管道三类非开挖修复技术汇总...
  4. ngx_http_redis_module配置使用
  5. 窗口结束后资源释放不掉问题解决办法
  6. Ingress-nginx工作原理和实践
  7. flash as3与后台php交互用户注册例子,as3与PHP后台交互2
  8. 让我们在Ubuntu 18.04上加密SSL证书来保护Nginx
  9. Linux应急响应篇
  10. 移动硬盘损坏:文件或目录已损坏(修复实录)
  11. 网站备案 服务器变更,网站变更服务器备案
  12. 三星s8是否支持html,真正的全面屏!国行三星S8终于支持导航栏隐藏
  13. 微信小程序使用RenderingContext进行图片尺寸压缩
  14. c语言看图猜价格小游戏程序,开心利是小程序看图猜谜答案公布
  15. 基于上下文的业务流建模法(三)
  16. 微前端框架qiankun之原理与实战
  17. VLAN 的作用及access端口类型、trunk端口类型、hybrid端口类型之间的特性
  18. java证书过期时间_我想用代码方式查看ca证书到期时间,以下是我的代码,可以显示日期,但是和实际的截止日期不一致...
  19. WIN7无法保存打印机设置错误0x000006d9处理办法(转载)
  20. 3.六大原则例子-- 依赖倒置原则(DIP)例子

热门文章

  1. libigl cot laplacian 计算方式
  2. c语言进行catia二次开发,想入门CATIA二次开发CAA的盆友们(谈谈开发经验,或许对你有帮助)...
  3. 华盛顿大学贪玩挂科GPA成绩找谁改
  4. 《致加西亚的一封信》读后感
  5. java实现身份证号码的严格校验!
  6. 使用高德开放平台显示指定的坐标点和线
  7. 无法启动程序因为计算机中丢失msvcr100,devenv.exe 系统错误无法启动此程序,因为计算机中丢失 MSVCR100.dll问题的解决办法...
  8. android 转 ios 开发,如何快速从android开发转向ios开发--oc语法篇
  9. springboot整合微信网页授权登陆
  10. 班主任工作总结中职计算机网络,中职班主任工作总结(优秀篇).doc