gtf与gff3文件【格式】【转换】
GFF3 官方
- General Feature Format Version 3
- 存储
序列结构信息
的一种数据格式。序列结构就是一个scaffold或者染色体上面每个位置都是什么序列元件。 - GFF每一行代表一个序列元件(以#为开头的注释行除外),一行9列9个属性,必须tab分割,属性为空用“.”代替。
1. seqid - scaffold或者chromosome的名称说明
2. source - 产生一个序列元件的软件的名称或者数据源(数据库名称或者项目名称)
3. type - 序列元件的类型,例如:mRNA、CDS等等
4. start - 序列元件在scaffold或者chromosome上的起始位置,从1开始计数
5. end - 序列元件在scaffold或者chromosome上面的终止位置,从1开始计数
6. score - 该序列元件的打分,一般为该序列元件做比对时的E-value和ab initio gene prediction features时的P-value
7. strand - “+”代表该序列元件在scaffold或者chromosome的正链,反之亦反
8. phase - 可以为“0”、“1”、“2”,“0”代表该序列元件的第一个碱基为第一个密码子的第一个剪辑,“1”代表该序列元件的第二个碱基是第一个密码子 的第一个碱基,依次类推。
9. attributes - 该序列元件的一些其他属性,可以有多个每个属性之间必须以“;”分割,例如“ID=some-id;Name=some-name;Parent=some-parent”,请注意这个Parent属性,由于序列元件是很复杂的,一个序列元件(例如:exon)可能属于另外一个序列元件(例如:gene),这个Parent属性的意思就是该序列元件在哪个序列元件上面,如果一个序列元件没有Parent属性,说明他的父元件就是scaffold或者chromosome
GFF文件的第9列,从第二版开始(GFF2),所有的属性都以标签=值的方式呈现,各个属性之间以;作为分隔符
GTF官方
当前所广泛使用的GTF格式为第二版(GTF2),它主要是用来描述基因的注释。GTF格式有两个硬标准
:
- 根据所使用的软件的不同,feature types是必须注明的。
- 第9列必须以gene_id以及transcript_id开头。GTF文件的第9列同GFF文件不同,虽然同样是标签与值配对的情况,但标签与值之间以空格分开,且每个特征之后都要有分号;(包括最后一个特征):
格式转换
Cufflinks里面的工具gffread
#gff2gtf
gffread my.gff3 -T -o my.gtf
#gtf2gff
gffread merged.gtf -o- > merged.gff3
gtf与gff3文件【格式】【转换】相关推荐
- java 图片文件 格式转换_Java的图片文件格式转换和线性缩放
Java的图片文件格式转换和线性缩放 来源:68design.net 2007年07月13日 08:31 图片文件格式转换最核心的问题就是要解决各种图片格式的编码和解码,推荐用jimi包,可从 htt ...
- 【FFmpeg】使用 FFmpeg 处理音视频格式转换流程 ( 解复用 | 解码 | 帧处理 | 编码 | 复用 )
FFmpeg 系列文章目录 [FFmpeg]Windows 搭建 FFmpeg 命令行运行环境 [FFmpeg]FFmpeg 相关术语简介 [FFmpeg]FFmpeg 相关术语简介 二 [FFmpe ...
- 文本文件编码与格式转换
不知道大家注意过没有,我们在软件开发过程中经常会发生如下情况: 用keil打开一个文件,显示乱码. Keil IDE编辑器编写的文件,在其他软件打开乱码 为什么会发生这样子的情况呢?根本原因是你使 ...
- ffmpeg格式转换之MP4转mov
原MP4格式视频文件 格式转换后mov格式文件 转换成功 实现方式 //引入c语言头文件 extern "C" {#include <libavformat\avformat ...
- GFF/GTF简介及格式转换
最近做转录组的比对时,在建立索引过程中,遇见一个问题,就是我从ncbi下载的序列文件和gtf文件中,染色体命名规则竟然不一样,但序列文件和gff文件染色体命名规则是一样的,具体来说:序列文件和GFF文 ...
- xm文件怎样转换成mp3_酷狗音乐如何将歌曲转换成MP3格式?方法超级简单
在我们平时的生活当中,听音乐来放松或者是打发时间,已经成为现代年轻人的一种娱乐方式.而我们平时听歌的时候,我们往往会遇到自己非常喜爱的歌曲,而此时将自己喜爱的歌曲下载下来后,想要存储到手机上继续听,但 ...
- drawboard pdf拆分文件_PDF处理神器,几秒钟搞定格式转换+压缩+加水印+解密!
PDF对于一个科研学习/工作者来说几乎每天都会接触,尤其是PDF格式转换的时候不知道怎么办,还有些文件加密了只能看不能编辑,有些几十页甚至几百页的文件每次翻看起来都特别麻烦,想防盗给自己的pdf文件加 ...
- vep文件如何转换mp4_如何将DVD的vob视频格式转换成mp4格式
首先简述一下,VOB是DVD Video OBject的缩写,vob文件用来保存所有MPEG-2格式的音频和视频数据,这些数据不仅包含影片本身,而且还有供菜单和按钮用的画面以及多种字幕的子画面流.如何 ...
- 3m格式的文件怎么转换成mp3_一招就能让PDF与其他格式文件相互转换,这样的大招你值得拥有...
大家都知道,现在不少的大佬比起用Word.Excel等等这些格式文件,它们更喜欢使用PDF文件.而我们不管是将Word.Excel等文件转换成PDF,还是将PDF转换成其他格式文件,都是一件麻烦事,更 ...
最新文章
- 正确的 send recv 行为
- 15-Arm-Confidential-Compute-Software-Stack
- 利用kinect检测任意平面
- oracle打开scott用户_Oracle 11gR2中启动Scott用户的方法(推荐)
- PHP从零开始--数据库
- 计算机学院肖鹏,肖鹏-生命科学与技术学院
- Spring Cloud实战小贴士:Zuul统一异常处理(三)【Dalston版】
- ArrayQueue详解(待解决)
- Android蓝牙开发教程(三)——蓝牙设备相互通讯
- 347.前K个高频元素(力扣leetcode) 博主可答疑该问题
- 汇编语言·易遗忘知识点汇总ing
- VS2019搭建C语言开发环境(图文教程)
- Origin正版申请
- SuperMap矢量瓦片优化方案
- tig只看某个作者的提交
- 钉钉小程序从搭建到引入地三方库到发布---企业内小程序
- 【Apache】配置.htaccess将主域名301重定向到www域名
- C语言标题下面程序用于输入三角形的三条边a,b,c,判断它们能否构成三角形,若能,则指出是何种三角形:等腰三角形、直角三角形、等腰直角三角形,一般三角形。若不能,则输出“不是三角形\n”
- html 游戏 调用震动,html5消息和震动api
- 为远程桌面Ubuntu配置固定的公网TCP端口地址【内网穿透】
热门文章
- 序列信号产生器的verilog HDL 设计
- 两个port贴合七夕主题,百度输入法的“情感营销”策略
- SqlMapConfig.xml
- 源代码解读Cas实现单点登出(single sign out)功能实现原理
- Python_017 GUI编程
- 设计模式系列3-----C++实现命令模式(Command Pattern)
- 聚焦与发散——浅谈编程的发展方向
- mvc后台字符串转换html,在mvc中,使用summernote编辑器,我想发送数据的内容字符串和HTML到控制器...
- MATLAB012b与vs2012混合编程——配置vs2012工作环境
- etcd 日志压缩_etcd集群备份和数据恢复以及优化运维