最近发现,需要对bed(chr  start  end)文件进行处理,当你不知道有什么其他软件可以用的时候,不妨用bedtools来试试,看看它的各种用法,估计能满足。看名字,就大概知道干什么用了。

bedtools工具可用于广泛的基因组学分析任务,即基因组上的集合论。例如,bedtools允许人们在广泛使用的基因组文件格式(例如BAM,BED,GFF / GTF,VCF)中交叉,合并,计数,补充和混洗来自多个文件的基因组间隔。虽然每个单独的工具被设计为执行相对简单的任务(例如,交叉两个间隔文件),但是可以通过在UNIX命令行上组合多个bedtools操作来进行非常复杂的分析。

输入文件为:bam格式

例如:计算一个bed文件中的reads数和GC含量

bedtools map -a target.bed -b realigned.bam -c 10,10 -o count,concat | awk -v OFS="\t" '{n=length($5); gc=gsub("[gcGC]", "", $5); print $1,$2,$3,$4,gc/n}'>out.txt

其中reads数和bamdst处理的差不多,偶尔有几条的区别。

输入文件为:fasta格式

计算各碱基的数目

bedtools nuc [OPTIONS] -fi <fasta> -bed <bed/gff/vcf>bedtools nuc -fi hg19.fa -bed target.bed |cut -f 1-4,5,13 >gc.txt results.txt

Output format: 
    The following information will be reported after each BED entry:
        1) %AT content
        2) %GC content
        3) Number of As observed
        4) Number of Cs observed
        5) Number of Gs observed
        6) Number of Ts observed
        7) Number of Ns observed
        8) Number of other bases observed
        9) The length of the explored sequence/interval.
        10) The seq. extracted from the FASTA file. (opt., if -seq is used)
        11) The number of times a user's pattern was observed.
            (opt., if -pattern is used.)

参考:https://www.plob.org/article/3748.html

https://www.plob.org/article/10690.html

统计bed文件下的reads数目和GC含量相关推荐

  1. xml遍历文件夹vector_怎么统计指定文件夹下含有.xml格式的文件数目

    如何统计指定文件夹下含有.xml格式的文件数目?如题 ------解决思路----------------------Directory.GetFiles(@"路径", " ...

  2. Linux下使用wc命令快速统计所有文件的行数

    语法:wc [选项] 文件- 说明:该命令统计给定文件中的字节数.字数.行数.如果没有给出文件名,则从标准输入读取.wc同时也给出所有指定文件的总统计数.字是由空格字符区分开的最大字符串. 该命令各选 ...

  3. 使用Java统计某个目录下各种类型文件的数量

    在日常工作中经常会统计一些数据,下面介绍一个例子,如何统计某个目录下边各种文件类型的文件数量. 本例子使用到了递归的算法,字符串的常用运算,文件的处理以及集合类的使用.是一个比较好的学习例子. /** ...

  4. Linux下统计当前文件夹下的文件个数、目录个数

    这篇文章主要介绍了Linux下统计当前文件夹下的文件个数.目录个数,本文使用ls命令配合管理.grep命令实现统计需求,需要的朋友可以参考下 1) 统计当前文件夹下文件的个数 复制代码 代码如下: l ...

  5. Linux统计某文件夹下文件、文件夹的个数

    统计某文件夹下文件的个数 ls -l |grep "^-"|wc -l 统计某文件夹下目录的个数 ls -l |grep "^d"|wc -l 统计文件夹下文件 ...

  6. python遍历指定文件夹的所有文件_python 统计指定文件夹下所有的文件数量,BFS方式...

    python 统计指定文件夹下所有的文件数量 本来一直是有这个需求,只是以前写的是递归的方式处理,感觉对资源的占用不友好,而且python的最大递归深度不超过1000,所以改了一下,这里用广度优先遍历 ...

  7. Linux统计某个文件夹下的文件个数、目录个数

    统计当前文件夹下文件的个数,包括子文件夹里的 ls -lR|grep "^-"|wc -l 统计文件夹下目录的个数,包括子文件夹里的 ls -lR|grep "^d&qu ...

  8. linux目录统计编程,linux系统编程----统计一个目录下的普通文件个数

    主要是为了统计linux系统下一个指定目录下面的普通文件个数,运用目录操作的一些函数,配合递归调用来实现该功能. 首先介绍一下函数原型: 打开一个空目录 DIR *opendir(const char ...

  9. 【原】Mac下统计任意文件夹中代码行数的工具——cloc

    这里介绍一个Mac系统统计代码行数的工具cloc. 1.首先,安装homebrew,已安装的请跳过. 打开终端工具Terminal,输入下列命令.过程中会让你按RETURN键以及输入mac桌面密码,按 ...

  10. Linux学习:读取目录内容 (目录名和类型)和递归统计指定目录下普通文件个数练习

    一.读取目录内容 #include <stdio.h> #include <unistd.h> #include <dirent.h> #include <s ...

最新文章

  1. 全文详解:「深度学习」如何协助处理医疗中的「数据难题」
  2. 表格排序——tablesorter.js使用(支持中文排序)
  3. 商丘网络推广分析网站留不住用户的原因及SEO解决方法
  4. 点击页面空白处就关闭某个层是怎么做到的
  5. 【渝粤教育】国家开放大学2018年秋季 0108-22T中央银行理论与实务 参考试题
  6. SSH加密密码中的非对称式密码学
  7. 信号扫描_图文并茂,一文读懂信号源
  8. 就9.5面试做个小结
  9. 使用FFTW的fftw_plan_dft_c2r_1d()由于未归一化结果错误的解决方案
  10. mysql提供的六种约束_MySQL中的六个约束
  11. sqlserver 2000 安装后本机如何连接_3030铝型材框架上的角槽连接件是如何安装固定的?...
  12. springboot中redis的工具类及配置类
  13. ✿ iBm T60 水货入手了 满意 2005
  14. 这两种方法能使PDF不能被复制和修改
  15. 树莓派:openCV之火焰检测
  16. android 刷机 3e,华为nova 3e官方出厂固件rom刷机包下载_nova3e完整版升级包
  17. 三相电机控制方式入门,看完这一篇就够了
  18. idea中translation插件显示网络异常(试一试)
  19. 如何实现调用阿里云三方的api
  20. 《大江大河2》里的创业故事

热门文章

  1. openwrt 添加usb网卡_如何在双网卡的蜗牛星际上打一个openwrt软路由和NAS一体机
  2. J-Flash使用方法
  3. Java编写五线谱上的音符_记住五线谱上音符的方法
  4. Latex学习笔记——字母的变体(正体、花体)
  5. 河北画报杂志河北画报杂志社河北画报编辑部2022年第20期目录
  6. 2020年苹果开学季+教育优惠详细讲解
  7. 5000头奶牛的数字化之旅
  8. 测试cpu多核性能软件,处理器多核性能测试_微星 X99A XPOWER GAMMING TITANIUM_CPUCPU评测-中关村在线...
  9. 20年在线考试计算机应用基础,20年春福师《计算机应用基础》在线作业一【参考答案】...
  10. 至强服务器性能排行,至强cpu天梯图,至强服务器cpu排行-