CNCI的使用--RNA蛋白编码预测软件
(生信)RNA蛋白编码预测软件-CNCI的使用
CNCI简介:
CNCI是由中科院研发的一款基于SVM(支持向量机)的LncRNA预测软件,它可以不依赖于已知的RNA注释信息来进行预测,同时其对不完全转录和反义的RNA有着良好的分类效果,本文将根据github的说明总结一些简单的操作。
软件安装与准备:
- linux 32位或者linux 64位系统
- python 2.74或者2.0版本(详细安装步骤见:https://blog.csdn.net/sherri_du/article/details/51810221)
- CNCI下载地址:https://github.com/www-bioinfo-org/CNCI#install-cnci
- CNCI的安装
git clone git@github.com:www-bioinfo-org/CNCI.git
cd CNCI
unzip libsvm-3.0.zip
cd libsvm-3.0
make
cd ..
程序简介:
共有三个.py程序可供使用,分别是:compare.py / CNCI.py / filter_novel_lincRNA
下面是官网说明书里面对它们的解释:
1,compare.py: compare the merged/assembled transcripts with known gene annotation!
2,CNCI.py: A classification tool for identify coding or non-coding transcripts (fasta files and gtf files)
3,filter_novel_lincRNA.py: A tool that can convert the index file which produced by python CNCI_package/CNCI.py to four gene classes (novel_lincRNA,novel_coding, ambiguous_genes and filter_out_noncoding)
compare.py是用于组装转录本与已知的基因注释间的比较,CNCI.py则用于LncRNA的预测,filter_novel_lincRNA.py是对结果index文件进一步分类。
使用与操作:
在本片文章中使用的测试文件来源于PLEK软件中的测试数据(PLEK_test.fa),PLEK也是一款LncRNA的预测软件。将测试的数据集放在与CNCI文件夹的同一路径下
python CNCI-master/CNCI.py -f PLEK_test.fa -o test -p 8 -m ve
输出的文件有两个文件夹,“test_Tmp_Dir”用于临时存放得分和序列的文件夹,“test”文件夹下存放着结果文件CNCI.index。
参数详解:
链接: https://github.com/www-bioinfo-org/CNCI#install-cnci
具体的参数说明见github官网,这里只解释一些简单的参数:
-f #输入文件名,可以是fasta可以是gtf格式
-g #当使用gtf格式的文件时,必须在文件后面加一个-g,例:-f unannotation.gtf -g
-p #线程数
-m #参考的分类模型
-o #输出文件
可选的分类模型有ve和pl两类,官网的解释是:
-m or --model : assign the classification models ("ve" for vertebrate species, "pl" for plat species)
个人感觉pl是指“植物“,不清楚”plat“是指什么分类。
结果文件:
在“test”文件下找到“CNCI.index”预测结果文件,包含四列信息:
Transcript ID index score start end length
gi|98961144|ref|NM_022571.5| Homo sapiens G protein-coupled receptor 135 (GPR135), mRNA coding 0.484 9 1485 1834
gi|53793662|ref|NM_001005466.1| Homo sapiens olfactory receptor, family 10, subfamily G, member 2 (OR10G2), mRNA coding 0.219 0 780 933
index会显示该转录本是否有蛋白编码能力,分别为coding和noncoding
补充:
github中关于CNCI使用的例子:
python CNCI_package/CNCI.py -f unannotation.gtf -g -o test -m ve -p 8 -d hg19.2bit
python filter_novel_lincRNA.py -i test.index -g unannotation.gtf -s 0 -l 200 -e exon_num -o out_dir
python extract.py -i novel-noncoding.gtf,nov.gtf -n known-non-coding.gtf -c known-coding.gtf
[参考文献]:
https://github.com/www-bioinfo-org/CNCI#install-cnci
http://nar.oxfordjournals.org/content/early/2013/08
CNCI的使用--RNA蛋白编码预测软件相关推荐
- CPAT:转录本蛋白编码能力预测软件
欢迎关注"生信修炼手册"! 随着高通量测序在lncRNA研究领域的应用, 越来越多的lncRNA被发现.对于转录组测序的数据而言,组装得到转录本之后,首先要做的就是区分蛋白编码和非 ...
- pfamscan 的使用_蛋白编码能力预测软件pfam流程
原标题:蛋白编码能力预测软件pfam流程 一.分析背景 蛋白一般由一个或多个功能域所组成,在不同蛋白质组合中出现的不同结构域导致了自然界中蛋白质复杂的多样性.鉴定一个蛋白中的结构域有助于更深入地理解蛋 ...
- GeneMark-ES:真核生物编码基因预测软件
欢迎关注"生信修炼手册"! GeneMark-ES软件用于预测真核生物中的蛋白编码基因,和其他预测基因结构的软件不同,它采用的是非监督算法,可以不依赖训练集进行预测.官网如下 ht ...
- Co-LncRNA:lncRNA与蛋白编码基因的共表达网络数据库
欢迎关注"生信修炼手册"! 有多项研究表明lncRNA与众多生物学过程,复杂疾病相关,为了进一步探究lncRNA在这些生命活动中的具体作用,我们需要对lncRNA的功能进行分析. ...
- batch软件功能测试,Batch SMART 最强序列特征[结构域]预测软件
写在前面 前天,在学位论文的完善中,有两个疑似ERF成员始终令我困扰. 植物转录因子中有个超家族AP2,包括两个亚家族,一个也叫AP2,另一个叫ERF.前者往往含有两个AP2结构域,后者则只含有一个A ...
- 生物工程学蛋白功能预测_海水中生长的工程细菌产生丝蛋白
生物工程学蛋白功能预测 Can this genetically-modified microbe help the fashion industry go green? 这种转基因微生物可以帮助时尚 ...
- android学习笔记---51_编码实现软件界面,把固定不变的界面写到xml中,逻辑改变的写到程序中,
2013/5/12 51_编码实现软件界面 -------------------------- 1.Android除了可以使用xml实现软件界面,还可以通过编码方式实现软件的界面,而且在某种情况下只 ...
- #今日论文推荐# 中国矿大团队,开发集成多尺度深度学习模型,用于 RNA 甲基化位点预测
#今日论文推荐# 中国矿大团队,开发集成多尺度深度学习模型,用于 RNA 甲基化位点预测 研究表明,通过转录后 RNA 修饰进行的表观转录组调控,对于所有种类的 RNA 都是必不可少的.准确识别 RN ...
- GAPIT 3.0:全基因组关联分析与预测软件最新版发布
近日,GPB在线发表了西南民族大学青藏高原动物遗传资源保护与利用(四川省.教育部)重点实验室题为"GAPIT Version 3: Boosting Power and Accuracy f ...
最新文章
- 荣获CHINA TOP cited paper award 2021的神经工程领域顶级期刊的论文汇总
- spring 两次进入拦截器_Spring Boot+Redis 扛住,瞬间千次重复提交(实例)
- [转载]C# PropertyGrid控件应用心得
- 一款嵌入式监听地图测试软件(开发)
- 程序包com.sun.istack.internal不存在
- 解决报错:java.util.UnknownFormatConversionException: Conversion = ‘p‘
- jquery点击事件传值加载页面_jQuery添加options点击事件并传值
- Uvaoj 11248 Frequency Hopping(Dinic求最小割)
- MySQL删除重复数据实例
- Qt——P5 命名规范及快捷键
- 同样是点工,凭什么他拿月薪20k,你却只有10k?
- 64位linux安装mysql数据库吗_linux下怎么安装mysql数据库
- python opencv人脸解锁_教你使用python+Opencv完成人脸解锁
- 【工赋开发者社区】产业互联网和工业互联网的区别
- 热敏打印机排版—打印机的指令
- UI设计,扁平化还是拟物化?
- pycharm逗号后面补空格_解决在pycharm 中复制代码时出现空格的方法
- 输入今天的日期,输出明天的日期
- Ubuntu22.04.1 LTS系统上实现KVM虚拟机显卡直通(AMD/NVIDIA+板载显卡)
- Windows安装You-get详细教程和问题解决分享
热门文章
- 曾仕强 中国式管理 观后感
- 渗透测试中的certutil
- 【leetcode】286. 墙与门
- windows防火墙设置_想偷窥我的电脑隐私信息?这款隐私保护软件对Windows系统说“No Way”...
- Stable Diffusion,给大家一点小小的固有印象
- 利用霍夫变换来进行圆环检测。
- LeetCode 827 最大人工岛 C++
- 广义回归神经网络(GRNN)
- 如何挖掘用户终身价值?开发会员制?
- android tf加密狗,【加密MicroSD (TF) sd接口加密狗key】价格_厂家 - 中国供应商