bed文件 坐 标的调整(awk的用法)

。annotatePeak的输入也可以是GRanges对象,你如果用R做peak calling的话,直接就可以衔接上ChIPseeker了。

require(ChIPseeker)
f = getSampleFiles()[[4]]
这里我们需要的是一个TxDb对象,这个TxDb就包含了我们需要的各种信息,ChIPseeker会把信息抽取出来,用于注释时使用。

require(TxDb.Hsapiens.UCSC.hg19.knownGene)
txdb = TxDb.Hsapiens.UCSC.hg19.knownGene
x = annotatePeak(f, tssRegion=c(-1000, 1000), TxDb=txdb)

Bioconductor里有很多包是针对GRanges对象的,这样方便你在R里做后续的处理,如果你说你不懂这些,只想输出个Excel表格。那么也很容易,用as.data.frame就可以转成data.frame,然后你就可以用write.table输出表格了。

第三种注释
两种注释有时候还不够,我想看peak上下游某个范围内(比如说-5k到5k的距离)都有什么基因,annotatePeak也可以做到。
你只要传个参数说你要这个信息,还有什么区间内,就可以了。

x = annotatePeak(f[[4]], tssRegion=c(-1000, 1000), TxDb=txdb, addFlankGeneInfo=TRUE, flankDistance=5000)输出中多三列: flank_txIds, flank_geneIds和flank_gene_distances,在指定范围内所有的基因都被列出。

awk ‘{print $1+1}’ su [【注意进行加减运算要看,有时候最后有空行也被运算!!】

删除空行
下列 5 种方法可以做到。

◈ sed:过滤和替换文本的流编辑器。
◈ grep:输出匹配到的行。
◈ cat:合并文件并打印内容到标准输出。
◈ tr:替换或删除字符。
◈ awk:awk 工具用于执行 awk 语言编写的程序,专门用于文本处理。
◈ perl:Perl 是一种用于处理文本的编程语言。

$ cat 2daygeek.txt
2daygeek.com is a best Linux blog to learn Linux.

It’s FIVE years old blog.

This website is maintained by Magesh M, it’s licensed under CC BY-NC 4.0.

He got two GIRL babys.

Her names are Tanisha & Renusha.

$ sed ‘/^$/d’ 2daygeek.txt
2daygeek.com is a best Linux blog to learn Linux.
It’s FIVE years old blog.
This website is maintained by Magesh M, it’s licensed under CC BY-NC 4.0.
He got two GIRL babes.
Her names are Tanisha & Renusha.

$ grep . 2daygeek.txt
or
$ grep -Ev “^$” 2daygeek.txt
or
$ grep -v -e ‘^$’ 2daygeek.txt
2daygeek.com is a best Linux blog to learn Linux.
It’s FIVE years old blog.
This website is maintained by Magesh M, it’s licensed under CC BY-NC 4.0.
He got two GIRL babes.
Her names are Tanisha & Renusha.
以下是命令展开的细节:

◈ grep: 该命令本身。
◈ .: 替换任意字符。
◈ ^: 匹配字符串开头。
◈ $: 匹配字符串结尾。
◈ E: 使用扩展正则匹配模式。
◈ e: 使用常规正则匹配模式。
◈ v: 反向匹配。
◈ 2daygeek.txt: 源文件名。

$ grep . 2daygeek.txt
or
$ grep -Ev “^$” 2daygeek.txt
or
$ grep -v -e ‘^$’ 2daygeek.txt
2daygeek.com is a best Linux blog to learn Linux.
It’s FIVE years old blog.
This website is maintained by Magesh M, it’s licensed under CC BY-NC 4.0.
He got two GIRL babes.
Her names are Tanisha & Renusha.
以下是命令展开的细节:

◈ awk: 该命令本身。
◈ //: 标记匹配范围。
◈ ^: 匹配字符串开头。
◈ $: 匹配字符串结尾。
◈ .: 匹配任意字符。
◈ !: 删除匹配的字符串。
◈ 2daygeek.txt: 源文件名。

4)使用awk命令进行简单的数学运算

[linuxmi@linux:~/linuxmi迷]$ awk ‘BEGIN{ a=9;b=8;print"(a + b)=",(a + b)}’
(a + b)= 17
[linuxmi@linux:~/linuxmi迷]$ awk ‘BEGIN{ a=100;b=78;print"(a - b)=",(a - b)}’
(a - b)= 22
[linuxmi@linux:~/linuxmi迷]$ awk ‘BEGIN{ a=80;b=5;print"(a / b)=",(a / b)}’
(a / b)= 16
[linuxmi@linux:~/linuxmi迷]$ awk ‘BEGIN{ a=80;b=5;print"(a ÷ b)=",(a / b)}’
(a ÷ b)= 16
[linuxmi@linux:~/linuxmi迷]$ awk ‘BEGIN{ a=10;b=9;print"(a × b)=",(a * b)}’
(a × b)= 90

https://mp.weixin.qq.com/s?src=11&timestamp=1595850298&ver=2486&signature=pS42jRFE8HChSmC4UkdIHZxr1edkIFN5CRcTFpwv5kNKFucOwlN28v10eKogWe45drNOvMcD0swXPTQJGKHrr2cN3kKl-fvWTyb9EiNmBysA6KU8YdZ4fiY7zk4fSOEQ&new=1数据详见:生信练习题:调整GFF文件中的坐标位置——by徐洲更

因此:

如果是#开头的注释部分,不处理
如果非#开头的部分,则需要将chr8后边的起始位置数值提取出来,实现将该值与后边两个位置列进行相加-1。具体对于第一行而言,就是使得第4列的30280+25234310-1,第5列的30951+25234310-1。并且在数据处理之后,去掉chr8后边这一串:25234310-25266151.
对于需要处理的数据,思路也比较简单,先按照冒号(

bed文件 坐 标的调整(awk的用法)相关推荐

  1. linux中awk的用法

    awk的用法 首先我们创建一个要测试的文件test 内容: 1 2 3 9 test:test1 str:d strd 第一个 awk 让我们继续,开始使用 awk,以了解其工作原理.在命令行中输入以 ...

  2. ARCGIS导入XY坐标的EXCEL文档,出现无法选择X和Y字段的问题

    近日用ARCGIS导入具有XY坐标的EXCEL文档时出现了无法选择X和Y字段的问题.像下图这样,在x field栏出现的字段应该是Excel文件中的x,但这个字段却没有出现. 最后发现是excel中数 ...

  3. 使用GDAL将下载的Google卫星图像转为带坐标的tif

    网上有很多下载Google地图的卫片的软件,一般下载下来的图像都是jpg格式的,另外附带一个坐标信息的描述文件.这样的数据不能直接拿来在遥感或者GIS软件中使用,因为图像里面没有投影和坐标信息,所以就 ...

  4. (P9)awk:什么是awk,awk简单用法,awk脚本语法,awk执行过程

    文章目录 1.什么是awk 2.awk简单用法 3.awk脚本语法 4.awk执行过程 1.什么是awk awk 是什么 awk 是一种用于处理数据和生成报告的编程语言 awk 可以在命令行中进行一些 ...

  5. 用毕安格将投影坐标的3dmax模型转换为3dtiles

    cesiumlab转换投影坐标的3dmax模型需要授权 下面用毕安格的工具来转换,当然试用期也是只有一个月 1.3dmax导出fbx 1.1 如果是绝对坐标,可以直接导出 1.2 如果是相对坐标,需要 ...

  6. GNU awk 的用法-文本处理三剑客之一

    GNU awk 的用法 awk 简介 文本处理三剑客 awk 工作原理 awk 用法 1.print 2.变量 2.1 内建变量 2.2 自定义变量 3.printf 命令 4.操作符 4.1 算术操 ...

  7. Shell学习六:awk的用法

    一.简介 awk是一种编程语言,用于在Linux/Unix下对文本和数据进行扫描与处理.数据可以来自标准输入.文件.管道.awk逐行扫描文件,从第一行到最后一行,寻找匹配特定模式的行,并在这些行上进行 ...

  8. MRT批量转hdf为带投影坐标的tif格式

    从事水文.大气.生态等工作的小伙伴可能需要用到卫星产品,Modis卫星数据具有全球免费.光谱范围广.数据接收简单.更新频率高等优点.就叶面积指数LAI而言,下载下来的数据为hdf格式,在Arcgis1 ...

  9. Python语言学习:创建/删除文件/文件夹、获取当前文件/文件夹路径(系统环境路径/目录)、获取当前文件夹下的所有子文件路径等代码(os系列用法)实现之详细攻略

    Python语言学习:创建/删除文件/文件夹.获取当前文件/文件夹路径(系统环境路径/目录).获取当前文件夹下的所有子文件路径等代码(os系列用法)实现之详细攻略 目录 系统环境路径的设置 1.sys ...

最新文章

  1. 一步一步写算法(之图结构)
  2. Nginx 安装及配置
  3. 自己整理的shell笔记
  4. 读书笔记之费曼讲义第一册
  5. win7组策略-计算机配置,win7系统组策略设置系统配置模块的操作方法
  6. java Set无序集合 HashSet 的对象元素唯一性
  7. 从远程服务器获取数据
  8. 03-20 专项测试-APP 启动性能分析
  9. java.lang.StringIndexOutOfBoundsException: String index out of range: 0错误的原因
  10. 隆冬寒骨,风吹十一豪迈
  11. Java基础面试题(2022年)
  12. AE+BodyMovin导出动画JSON文件
  13. si4463的寄存器使用说明
  14. u盘写保护,无法格式化
  15. 监督学习、无监督学习、强化学习概念
  16. mysql根据出生年月计算年龄
  17. Gauntlet风险评级上线: DeFi杠杆率多高?会不会崩盘?
  18. 在Ubuntu上安装Tensorflow Serving
  19. 你被抖音“魔性”的设计风格洗脑了吗?
  20. 第一、二章大数据与Hadoop的概述

热门文章

  1. python爬取地图地址_网络爬虫-python爬取高德地图地点
  2. 爬了深圳3W+二手房我发现了这些秘密
  3. 一篇文章带你了解AO、GO
  4. 关于工业相机编程调用SDK二次开发的一些步骤流程
  5. 小芭比linux怎么装win7_Linux系统怎么安装Win7?安装XP或WIN7系统教程
  6. 10-3 B1-5查询客户的订单情况
  7. Java课程中心练习题
  8. 墨云saas系统总结
  9. 大连 Oracle LMS,oracle rac后台进程和LMS说明
  10. 2019年编程走进中小学课堂,AI读伴应运而生