简介

mirDeep2可用于新microRNA的预测,以及microRNA的定量
这个软件由多个perl脚本模块组成

  • mapper.pl
  • miRDeep2.pl
  • quantifier.pl

下载安装

## 首先下载和解压缩
wget https://github.com/rajewsky-lab/mirdeep2/archive/v0.1.3.tar.gz
tar -xvzf v0.1.3.tar.gz
## 然后安装,软件会自动安装
# source ~/.bashrc (此步骤根据软件提示而定)
perl install.pl

使用方法

Step1, 从miRbase中提取相应物种的所有microRNA参考序列

  • mirDeep2提供一个perl脚本,帮助用户从miRbase的microRNA的fasta文件中,提取自己所需物种的microRNA序列
# 提取mature
extract_miRNAs.pl ~/mirbase/21/mature.fa.gz hsa > mature_ref.fa
# 提取hairpin
extract_miRNAs.pl ~/mirbase/21/hairpin.fa.gz hsa > hairpin_ref.fa
  • 同时可以为miRdeep2提供其它近缘物种的microRNA序列,以辅助新microRNA的预测
extract_miRNAs.pl ~/mirbase/21/mature.fa.gz mmu,ptr > mature_other.fa

Step2, bowtie1为参考基因组建立索引

  • 因为之后miRdeep2会将microRNA回帖到基因组上,所以要提前为我们所选物种的参考基因组构建bowtie1的索引 (注意是使用Bowtie1, 不是Bowtie2 ! )
bowtie-build refdb.fa refdb.fa

Step3, 新microRNA预测前的数据预处理

mapper.pl example_small_rna_file.fastq -e -h -i -j -k TGGAATTC -l 18 -m -p refdb.fa -s reads_collapsed.fa -t reads_vs_refdb.arf -v -o 4
  • -e 输入为fastq文件,如果输入是 fasta文件则使用 -c 参数
  • -h 输入文件如果不是 fasta格式(例如输入为fastq文件) 那么,就需要指定-h参数, -h参数可以将非fasta文件解析为fasta格式
  • -i 将RNA转换为DNA
  • -j 去除ACGTN以外的序列
  • -k 去除指定的adaptor, 这里我们的输入是去除序列开头的 adaptor TGGAATTC
  • l 最短的序列长度,这里我们写18(mirna一般长度是18-25 nt)
  • -m 删除文件中冗余的序列,例如某条序列在文件中重复出现了十次,那么软件将会把这条序列的另外9条删掉,只保留一条非重复的unique 序列,这条非重复的序列的标识符中将加上 _x10
  • -p 指定使用的参考基因组的索引前缀
  • -s 输出文件名
  • -t 输出arf 格式的文件
  • -v outputs progress report
  • -o number of threads to use for bowtie

Step4, 预测新microRNA

miRDeep2.pl reads_collapsed.fa refdb.fa reads_vs_refdb.arf mature_ref.fa mature_other.fa hairpin_ref.fa -t hsa 2>report.log

Step5, microRNA定量

  • 我们使用 miRdeep2的 quantifier.pl 脚本来完成microRNA的定量
  • 输入文件必需包括三份: 含有microRNA前体序列的fasta文件(来源于miRBase),含有成熟microRNA序列的fasta文件(miRBase), 我们自己测序得到的microRNA文件
  • 可选输入:star.fa, 明星序列(来源于miRBase)
quantifier.pl -p precursors.fa -m mature.fa -r reads.fa -s star.fa -y now -t cel
  • -t 指定物种(三个字母缩写的前缀)

报错

Rfam_for_miRDeep.fa not found in your miRDeep2 scripts directory

因为我是通过bioconda下载的miRDeep2,所以出现了这个错误。 我去github上看到了miRDeep2官方的解释是,它们并没有把miRDeep2放到bioconda上,自己去github下载安装miRDeep2是不会出现这个问题的。 所以大家如果出现了这个错误,就自己去github上下载原版的软件 自己安装使用吧!

git clone https://github.com/rajewsky-lab/mirdeep2.git

参考

  • https://www.jianshu.com/p/ebf162ae5690
  • https://www.mdc-berlin.de/content/mirdeep2-documentation
  • https://drmirdeep.github.io/mirdeep2_tutorial.html

mirdeep2使用笔记相关推荐

  1. 【读书笔记】知易行难,多实践

    前言: 其实,我不喜欢看书,只是喜欢找答案,想通过专业的解答来解决我生活的困惑.所以,我听了很多书,也看了很多书,但看完书,没有很多的实践,导致我并不很深入在很多时候. 分享读书笔记: <高效1 ...

  2. 【运维学习笔记】生命不息,搞事开始。。。

    001生命不息,搞事不止!!! 这段时间和hexesdesu搞了很多事情! 之前是机械硬盘和固态硬盘的测速,我就在那默默的看着他一个硬盘一个机械测来测去. 坐在他后面,每天都能看到这位萌萌的小男孩,各 ...

  3. SSAN 关系抽取 论文笔记

    20210621 https://zhuanlan.zhihu.com/p/353183322 [KG笔记]八.文档级(Document Level)关系抽取任务 共指id嵌入一样 但是实体嵌入的时候 ...

  4. pandas以前笔记

    # -*- coding: utf-8 -*- """ Created on Sat Jul 21 20:06:20 2018@author: heimi "& ...

  5. PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 call

    您的位置 首页 PyTorch 学习笔记系列 PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 发布: 2017年8月4日 7,195阅读 ...

  6. 容器云原生DevOps学习笔记——第三期:从零搭建CI/CD系统标准化交付流程

    暑期实习期间,所在的技术中台-效能研发团队规划设计并结合公司开源协同实现符合DevOps理念的研发工具平台,实现研发过程自动化.标准化: 实习期间对DevOps的理解一直懵懵懂懂,最近观看了阿里专家带 ...

  7. 容器云原生DevOps学习笔记——第二期:如何快速高质量的应用容器化迁移

    暑期实习期间,所在的技术中台-效能研发团队规划设计并结合公司开源协同实现符合DevOps理念的研发工具平台,实现研发过程自动化.标准化: 实习期间对DevOps的理解一直懵懵懂懂,最近观看了阿里专家带 ...

  8. 王道考研 计算机网络笔记 第六章:应用层

    本文基于2019 王道考研 计算机网络: 2019 王道考研 计算机网络 个人笔记总结 第一章:王道考研 计算机网络笔记 第一章:概述&计算机网络体系结构 第二章:王道考研 计算机网络笔记 第 ...

  9. 王道考研 计算机网络笔记 第五章:传输层

    本文基于2019 王道考研 计算机网络: 2019 王道考研 计算机网络 个人笔记总结 第一章:王道考研 计算机网络笔记 第一章:概述&计算机网络体系结构 第二章:王道考研 计算机网络笔记 第 ...

  10. 王道考研 计算机网络笔记 第四章:网络层

    本文基于2019 王道考研 计算机网络: 2019 王道考研 计算机网络 个人笔记总结 第一章:王道考研 计算机网络笔记 第一章:概述&计算机网络体系结构 第二章:王道考研 计算机网络笔记 第 ...

最新文章

  1. pytorch 卷积分组
  2. 使用GAN 进行异常检测——anoGAN,TODO,待用于安全分析实验
  3. 算法竞赛入门经典读书笔记(二)7.1简单枚举
  4. HashedWheelTimer时间轮原理分析
  5. localstorage || globalStorage || userData
  6. axure中备注线_Axure教程资料
  7. python中for循环和while循环的区别_Python中for循环语句和while循环语句有何不同
  8. 文档自动同步云服务器,​文件自动同步网盘能实现吗?
  9. 程序员量子力学-海森堡式BUG
  10. Python输入一个表示星期的数字(1表示星期一,2表示星期二......6表示星期六,7表示星期日),输出对应的星期英文单词
  11. Opencv裁剪图片大小
  12. 在上海奋斗的五年---从月薪3500到700万 (一个西北真汉子的人生)
  13. python分段函数编写程序_python分段函数如何编写?
  14. 盘点激光雷达技术在智能交通上的应用
  15. java读取pdf文本转换html
  16. 【体系-微服务架构】23-Spring Cloud Spring生态链(Alibaba)
  17. 那些名站的网站关键词都是如何到百度首页的
  18. 【Vue】Vue3脚手架
  19. SAP 远程连接登录配置(SAP Router)
  20. 服务器异常网站被百度转码,使用百度云加速后网站访问出现416错误

热门文章

  1. Tomcat下work文件夹的作用
  2. jquery实现点击元素,如果弹出层隐藏则显示,显示则隐藏
  3. 用struts拦截器实现登录验证功能AuthorizationInterceptor
  4. 如何去掉桌面图标上的小箭头
  5. 《WinForm开发系列之控件篇》Item12 DateTimePicker(暂无)
  6. 无线AP与无线路由器都有些什么区别?(二)
  7. 14.1宽屏Intel集显调分辨率:无解
  8. android 快速启动 hibernate,什么是快速启动以及如何在Windows中启用或禁用它 | MOS86...
  9. java 数据流 中文_【Java I/O流】File、字符集、字节流、字符流、缓冲流、数据流、对象流、序列化、try-wi...
  10. covariance matrix r语言_R语言 第2章 数据对象与数据读写(3)