miRDeep-P2 利用small RNA 二代测序结果识别植物中的miRNA基因,尤其是那些尚未得到较好注释的物种。

安装篇

miRDP2是一个分析流程,也就意味着执行该软件之前需要先安装其他软件

  • Bowtie : 比对软件,适合35bp点的短读
  • Bowtie2: 比对软件, 适合50bp ~ 1000 bp的短读
  • Vienna: RNA二级结构预测软件大礼包

预先安装以上软件之后,然后在mirdp2下载最新版的miRDP2, 以及ncRNA_rfam.tar.gz

# 个人习惯: 生信软件安装在 /opt/biosoft 下载
tar xf miRDP2-v1.1.2
mv 1.1.2 /opt/biosoft/miRDP2-v1.1.2

注意: 1.1.2版本的miRDP2-v1.1.2_pipeline.bash脚本中存在一行bug,src=${0%%/miRDP2-v1.1.1_pipeline.bash}, 原本目标是利用变量名替换获取执行文件的路径,然而它却忘了将1.1.1改成1.1.2了,请按照我下面的代码进行更改。

#src=${0%%/miRDP2-v1.1.1_pipeline.bash}
src=$(dirname $0)

在TestData下载测试数据集--TestData.tar.gz 。

运行篇

新建一个文件夹,用于存放下载的测试数据集

mkdir -p miRDP2_Test

之后将下载的测试数据集和非编码RNA的Rfam文件上传到该文件夹中,对两个文件进行解压缩

tar xf ncRNA_rfam.tar.gz
tar xf TestData.tar.gz

分别为参考基因组和和非编码RNA的Rfam建立索引

bowtie-build --threads 8 -f ./TestData/TAIR10_genome.fa ./TestData/TAIR10_genome
# 为Rfam建立索引,一定得在流程的script/index 目录下
bowtie-build --threads 20 -f ./ncRNA_rfam.fa /opt/biosoft/miRDP2-v1.1.2/scripts/rfam_index

运行流程

miRDP2-v1.1.2_pipeline.bash -g ./TestData/TAIR10_genome.fa -i ./TestData/TAIR10_genome -f ./TestData/GSM2094927.fa -o . &
# -g: 基因组序列
# -i: bowtie索引
# -f sRNA-seq 文件
# -o 输出文件夹

运行结束之后会在当前目录下出现一个目录 GSM2094927-15-0-10, 主要关注如下内容:

  • miRNA预测结果: GSM2094927-15-0-10_filter_P_prediction, 每列的内容分别为,“染色体编号”,“所在链”,“代表性的短读编号”,“前体编号”,“成熟miRNA位置”,“前体位置”,“成熟序列”,“前体序列 ”
  • 日志文件: script_logscript_err, 在运行出错时用于排除

数据预处理

这一步是为了给流程提供可用的输入文件,主要是将fastq文件转换成流程所需的fasta文件。

第一步: 去接头。miRNA长度仅有21 nt,而测序一般至少都有50bp,因此需要去除一些接头序列。这一步公司负责处理。如果要自己处理,我推荐用cutadapt.

第二步: 将fastq文件转成fasta文件

第三步:去除冗余序列, 每个短读的编号形如"read0_x29909", x后面表示相同的序列数

最后要保证FASTA中的每个序列都唯一。

「miRNA-seq」miRNA预测工具miRDeep-P2的简明教程相关推荐

  1. 「免费版Axure」原型设计工具!

    Axure 是一款经典的原型设计工具,但需要下载电脑端软件使用,对新手要求较高,且在线协作效率低,使用成本较高.即时设计是一款免费在线原型设计工具,支持导入 Axure 文件进行二次布局.评审.演示和 ...

  2. 2019b官方手册中文版_数据科学|「最全」实至名归,NumPy 官方早有中文教程,结合深度学习,还有防脱发指南...

    文章须知 文章作者:机器之心 责任编辑:书生 审核编辑:阿春 微信编辑:玖蓁 本文转载自公众号 机器之心 (ID:almosthuman2014) 原文链接:「最全」实至名归,NumPy 官方早有中文 ...

  3. 「JVM 故障诊断」命令行工具

    给定一个系统问题,知识.经验是关键基础,数据(异常堆栈.JVM 运行日志.GC 日志.线程快照 threaddump/javacore.堆转储快照 heap dump/hprof 等)是依据,工具是运 ...

  4. 「最全」实至名归,NumPy 官方早有中文教程,结合深度学习,还有防脱发指南...

    本文来自机器之心 参与:一鸣.Jamin NumPy 无疑是很多机器学习研究者和开发者的「白月光」.如此优秀的项目,没有中文版怎么行?近日,机器之心发现 NumPy 官方早在去年就已出了一个中文版网站 ...

  5. 找论文太难?试试这款「文本生成」论文搜索工具

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI NLP工 ...

  6. 找论文太难?试试这款「文本生成」论文搜索工具丨开源

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要3分钟 Follow小博主,每天更新前沿干货 转载自:量子位 NLP工作者,尤其是文本生成领域的工作者们,你们福音来了! ArXiv Text ...

  7. 模板使用自定义类型_「Shopify模板」Shopify模板编辑Shopify模板代码更改教程

    Shopify模版是决定在线商店外观的模板.不同模版的样式和布局有所不同,可为客户提供不同的体验.例如,如果您销售的是水疗产品,那么您可能希望您的在线商店给人一种放松和奢华的感觉.或者,如果您销售的是 ...

  8. excel线性拟合的斜率_邵励治的机器学习 2 / 100 天:「简单线性回归」

    前言 好了,我们闲言碎语不多讲,下面开始 机器学习100天:第2天 的学习! 另外,如果看官老爷喜欢我的文章,还请点个赞的说! 这是对我的认真分享最好的鼓励! 知识储备环节 今天我们学习的内容是:&q ...

  9. 用AI「复活」逝者:「深度怀旧」项目火遍推特,我们也用民国老照片试了下 #蚂蚁呀嘿

    转载自:机器之心 最终,我们或许能让那些过去的人们,「亲自」为我们讲述他们自己的故事. 最近几个星期,一股由 AI 引发的「动起来」趋势席卷全网,各种让照片变视频的动画不时出现在各大社交网络的时间线上 ...

  10. Android备份到电脑,用 TWRP「一键 Ghost」你的 Android 手机,还能备份到电脑

    Android 玩家对手机备份想必都不陌生,少数派也介绍过一些优秀的备份工具,比如钛备份和 Swift Backup 等等.但是,这些工具大都只能备份应用和数据,却无法直接给系统来一次「一键 Ghos ...

最新文章

  1. 元气骑士机器人修好后怎么用_《元气骑士》五大“难度”挑战,从手速到恶搞很嗨,还能解锁皮肤...
  2. 三十八、Vue项目上手 | 用户管理系统(上篇)
  3. 关于AJAX跨域调用ASP.NET MVC或者WebAPI服务的问题及解决方案
  4. get php 怎么用,php getdate函数怎么用
  5. _Linux 的文件系统及文件缓存知识点整理
  6. 线程其实就是一个个指令组成的,当这个线程内的指令全部执行完了,那么这个线程也就执行结束了
  7. 20个最佳WordPress SEO插件
  8. ALEIS,啊,累死
  9. VS 2010 SP1 and SQL CE :ScottGu's Blog
  10. C++引用(作为函数参数和返回值)
  11. POI多个Sheet生成Excel
  12. 对抗神经网络(Adversarial Nets)的介绍[1]
  13. 凭什么?80后合伙人“叫板Excel”
  14. php怎么触发js函数,如何从PHP调用JavaScript函数?
  15. 太阳系各大行星运行轨迹
  16. android 百度网盘 播放器,最好用的安卓播放器,支持云盘播放,看电影必备
  17. ssh整合(spring+springmvc+hibernate)
  18. 华为ensp联动Wmware虚拟机Openstack平台实现Vlan网络模式
  19. VScode seting.json 配置 自用
  20. Python库的使用

热门文章

  1. 键盘摄影(七)——深入理解图像信号处理器 ISP
  2. 吴恩达机器学习(十一)正规方程
  3. WINDOWS 7 家庭普通版升级旗舰版
  4. android framelayout view上下层_理解并测试什么是Android事件分发
  5. 长江后浪推前浪 被移动支付拍到沙滩上的行业有哪些?
  6. android studio添加v7包,如何在Android Studio中添加RecyclerView-v7支持包
  7. 进口面料洗标大全_巧手缝纫_新浪博客
  8. 简述中断处理的6个步骤_微机原理简答题
  9. 笔记本电脑如何将屏幕投影到电视上
  10. 批量下载图片,批量重命名图片(有序、无序都可)