文章目录

  • 介绍
    • 一、variableStep 格式
      • 1、特点及适用场景:
      • 2、格式:
      • 3、例子:
    • 二、fixedStep 格式
      • 1、特点及适用场景:
      • 2、格式:
      • 3、例子:
    • 三、数据值
      • 例子

Wig,BigWig,BedGraph,这是几种在基因组浏览器上绘制图形的数据格式。

不同的数据格式可以满足不同的显示需求,下面我们一一来看:

介绍

wig 文件全称叫 Wiggle Track Format, 用来绘制基因组上的图形轨迹的文件格式。wig 格式是较老的格式,用来显示密集且连续的数据,比如GC含量,概率分数,转录组数据等。

wig 数据有两种类型:variableStep 和 fixedStep。

我们先来研究这两种类型的文件,后面在基因组浏览器中利用这些文件显示轨迹。

一、variableStep 格式

1、特点及适用场景:
  • 在指定的染色体片段区域绘制条形图
  • 用于全基因组数据集(大约百万分之十的数据点)
  • 指定的区域必须为恒定大小(由span参数指定)
  • 数据点间具有不规则间隔的数据,但是在某些情况下建议谨慎
  • 如果数据点的不规则间距太极端,此格式在编码和显示期间可能效率很低。在这种情况下,“bedGraph”是最佳格式。
  • 一般UCSC不建议采用该格式作为基因组浏览器输入文件,因为考虑到数据集大小与索引构建,都不如 bigwig 更高效
  • 使用 wigToBigWig 将 Wig 转换为 bigWig 文件,文件格式转换详解
2、格式:

声明行:以单词variableStep开头,后跟染色体规范。

数据行:两列,分别包含染色体位置和数据值。

variableStep  chrom=chrN
[span=windowSize]chromStartA  dataValueAchromStartB  dataValueB... etc ...  ... etc ...
3、例子:

下面表示在2号染色体上的300701-300705位置均显示12.5

variableStep chrom=chr2
300701 12.5
300702 12.5
300703 12.5
300704 12.5
300705 12.5

可选的span参数(默认值:span = 1)允许更简洁地指定由连续的具有相同数据值的碱基组成的数据。

跨度从指定的每个染色体位置开始,并指示数据值应覆盖的碱基数。例如: 应用span=5后,相当于:

variableStep chrom=chr2 span=5
300701 12.5

wiggle 格式用于快速显示非常密集的数据。当每1,024个碱基只有几个数据点时,variableStep格式会变得效率极低。

如果variableStep数据点相距大于约100个碱基,则建议使用 BedGraph格式。

二、fixedStep 格式

1、特点及适用场景:
  • 在指定的染色体片段区域绘制条形图
  • 最适合用于全基因组数据集(大约百万分之十的数据点)
  • 指定的区域必须为恒定大小(由span参数指定)
  • 染色体位置精确地有规律的间隔(由step参数指定)
2、格式:

声明行:单词fixedStep开头,并包含染色体,起始坐标和步长的规范 。

数据行:一列,包含数据值。

fixedStep  chrom=chrN
start=position  step=stepInterval
[span=windowSize]dataValue1dataValue2... etc ...
3、例子:

表示3号染色体上的三个区域(每个区域5个碱基):400601-400605、400701-400705和400801-400805,分别显示值11、22和33

fixedStep chrom=chr3 start=400601 step=100 span=5
11
22
33

对于variableStep和fixedStep格式,必须在整个数据集中使用相同的。如果未指定跨度,则使用默认跨度1。

顾名思义,fixedStep 在整个数据集中需要相同的大小步长。如果未指定,则步长为1。

三、数据值

wiggle 格式的数据值可以包含整数,实数,正值或负值,但不支持 NaN 值。未指定的位置没有数据,也就不会显示。

需要注意:wiggle文件(variableStep and fixedStep )的染色体坐标是从1开始。

例如,对于长度为N的染色体,第一个位置为1,最后一个位置为N。

对于 bigwig 文件,使用 wiggle 转换为 bigwig,使用的染色体坐标是从1开始。

而使用bedGraph格式创建的BigWig文件使用0开始。

自定义 wiggle 轨迹的参数

track type=wiggle_0 name=track_label
description=center_label
visibility=display_mode color=r,g,b
altColor=r,g,b priority=priority
autoScale=on|off alwaysZero=on|off
gridDefault=on|off
maxHeightPixels=max:default:min
graphType=bar|points
viewLimits=lower:upper
yLineMark=real-value yLineOnOff=on|off
windowingFunction=mean+whiskers|maximum|mean|minimum
smoothingWindow=off|2-16

其他参数

autoScale         <on|off>                             # default is on
alwaysZero        <on|off>                             # default is off
gridDefault       <on|off>                             # default is off
maxHeightPixels   <max:default:min>                    # default is 128:128:11
graphType         <bar|points>                         # default is bar
viewLimits        <lower:upper>                        # default is range found in data
viewLimitsMax     <lower:upper>                        # suggested bounds of viewLimits, but not enforced
yLineMark         <real-value>                         # default is 0.0
yLineOnOff        <on|off>                             # default is off
windowingFunction <mean+whiskers|maximum|mean|minimum> # default is maximum, mean+whiskers is recommended
smoothingWindow   <off|[2-16]>                         # default is off
transformFunc     <NONE|LOG>                           # default is NONE
例子

1、下面是 Wig 格式的文件,分别包含 variableStep 和 fixedStep 格式创建的两段轨迹

browser position chr19:49304200-49310700
browser hide all
#   150 base wide bar graph at arbitrarily spaced positions,
#   threshold line drawn at y=11.76
#   autoScale off viewing range set to [0:25]
#   priority = 10 positions this as the first graph
#   Note, one-relative coordinate system in use for this format
track type=wiggle_0 name="variableStep" description="variableStep format" visibility=full autoScale=off viewLimits=0.0:25.0 color=50,150,255 yLineMark=11.76 yLineOnOff=on priority=10
variableStep chrom=chr19 span=150
49304701 10.0
49304901 12.5
49305401 15.0
49305601 17.5
49305901 20.0
49306081 17.5
49306301 15.0
49306691 12.5
49307871 10.0
#   200 base wide points graph at every 300 bases, 50 pixel high graph
#   autoScale off and viewing range set to [0:1000]
#   priority = 20 positions this as the second graph
#   Note, one-relative coordinate system in use for this format
track type=wiggle_0 name="fixedStep" description="fixedStep format" visibility=full autoScale=off viewLimits=0:1000 color=0,200,100 maxHeightPixels=100:50:20 graphType=points priority=20
fixedStep chrom=chr19 start=49307401 step=300 span=200
1000900800700600500400300200100

2、 选择菜单栏My DataCustom Tracks

3、将上面的代码粘贴到输入框,点 Submit

4、简要信息显示,点Go进行绘制

5、拿到绘制好的轨迹图

生信格式 | wig(基因组浏览器绘制)相关推荐

  1. 生信格式 | BedGraph(基因组浏览器绘制)

    一.特点及适用场景: 存放区间的坐标轴信息和相关评分(score)的文件,主要用于存储稀疏,不连续的数据 后缀名.bedGraph 一般UCSC不建议采用该格式作为基因组浏览器输入文件,因为考虑到数据 ...

  2. 【生信】全基因组关联分析(GWAS)原理

    [生信]全基因组关联分析(GWAS)原理 文章的文字/图片/代码部分/全部来源网络或学术论文,文章会持续修缮更新,仅供大家学习使用. 目录 [生信]全基因组关联分析(GWAS) 1.前提知识介绍 1. ...

  3. 生信格式 | bigwig,bw (基因组浏览器绘制)

    文章目录 一.特点及适用场景: 二.wig 转 bigwig 三.bedGraph 转 bigwig 四.其他工具 一.特点及适用场景: 存放区间的坐标轴信息(如染色质可及性,转录因子结合区域)和相关 ...

  4. 生信软件5 - RIdeogram包绘制染色体密度图

    该R包在全基因组测序WGS中可以通过用于描述突变位点在染色体上的分布,在转录组测序RNA-Seq中可用于描述差异表达基因在染色体上的分布,在WGBS中可用于描述DNA甲基化在染色体上的分布等. R包软 ...

  5. 生信格式 | GAF GO注释文件详解

    下载 http://current.geneontology.org/products/pages/downloads.html GOC(Gene Ontology Consortium)提供了41种 ...

  6. 生信格式 | Fasta格式 图解

  7. C#,生信软件实践(03)——DNA数据库GenBank格式详解及转为FASTA序列格式的源代码

    1 GenBank 1.1 NCBI--美国国家生物技术信息中心(美国国立生物技术信息中心) NCBI(美国国立生物技术信息中心)是在NIH的国立医学图书馆(NLM)的一个分支.它的使命包括四项任务: ...

  8. 生信常用分析图形绘制03 -- 富集分析圈图

    有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧! 由于本系列的所有分析代码均为师兄 ...

  9. 生信常用分析图形绘制01 -- 各种类型的热图!你学会了吗?

    有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧! 由于本系列的所有分析代码均为师兄 ...

最新文章

  1. 为HttpStatusCodeResult加入customErrors
  2. PAT 乙级(Basic Level) 题解汇总(持续更新)(C++)
  3. linux gcc 7.3.0安装,升级gcc到7.3.0
  4. 王不留,混迹基层八年穷屌丝,考研准备四个月,考上中国科技大学MBA,成为一家软件上市公司中层管理者(附备考攻略)
  5. AD7124采集工作流程
  6. 基于Nonebot2搭建QQ机器人(三)Linux端部署机器人
  7. linux 第六章 linux中的进程管理
  8. JavaScript获取移动设备型号的实现代码(JS获取手机型号和系统)
  9. 图片从RGB转换成Lab
  10. 安装mentohust 64位
  11. 使用Python根据视频链接下载MP4视频
  12. c语言输出变量案例,C语言经典例题100例——C语言练习实例41解答(static静态变量的用法)...
  13. Eclipse官网地址
  14. 云和恩墨 -全球化数据资产端到端解决方案服务商
  15. 如何防止表单重复提交(后端)
  16. 职称计算机pptt应用模块,2016年职称计算机考试PowerPoint单选练习题4
  17. APK文件使用ApkTool解包反编译和重新打包及签名
  18. 吕文哲:为什么我说EOS完爆以太坊,理由全在这里了
  19. CRITICAL_SECTION的使用方法——模拟售票功能
  20. [Unity热更新]tolua# LuaFramework(七):lua使用DOTween

热门文章

  1. 误差反向传播法实现手写数字识别(纯numpy实现)
  2. 七牛上传图片初探 开始上传 暂停上传 继续上传
  3. 怎么在电脑上进行音频以及视频的素材合并
  4. bzoj-1227 虔诚的墓主人
  5. 因为此版本的应用程序不支持其项目类型(.csproj),若要打开它,请使用支持此类型项目的版本
  6. 【技术文档】《算法设计与分析导论》R.C.T.Lee等·第6章 剪枝搜索方法
  7. VBS的msgbox函数用法
  8. 微信小程序如何引入直播组件?
  9. 计算机二级考试内容是什么
  10. 如何制作动态拼图?教你如何在线拼接动图