把当前文件夹的文件名用","连接成一行,或者将多行转变为一行

ls | paste -s -d ","  # -s 选项将输入进行一次性粘贴
ls | xargs | sed 's/ /,/g'  #xargs 将输入作为参数(空格分隔)传入
ls | awk '{printf "%s,",$0}'

将行逆序输出

sed '1!G;h;$!d'file  # 1!G 第一行不执行G命令,从第二行开始执行;$!d 最后一行不删除;第一行自动存入模式空间,将模式空间内容(第一行)放到保持空间(h),然后删除模式空间内容(d,否则它会自动输出),第二行自动存入模式空间,(开始用G)将保持空间(第一行内容)接到模式空间(第二行)后,将当前模式空间(第二行+第一行)放到保持空间(h),然后删除当前模式空间(d),依次类推,最后一行不删除模式空间,再自动输出模式空间内容
tac file

删除#开头的注释行

sed '/^#.*/d' test.txt

去掉每行开头4个字符

cut -c 4- test.csv

对文件第一列进行统计

awk -F "," '{count[$1]++} END{for (record in count) print record,count[record] }' test.csv  #count[$1]++创建关联数组count[$1]并进行计数

对文件第四列用":"切割成两列并将最后一列结果+1,然后输出全部列

awk -F "," '{split($4,array,":");print $1,$2,$3,array[1],array[2]+1}' test.csv  #split切割$4存到数组array中,array[1]和arrya[2]即为切割后的两个区域

对文件第二列求均值

awk -F "," '{sum+=$2} END {print "Average = ", sum/NR}' test.csv

实现DNA序列反向互补

cat seq.txt | sed 'y/ATGC/TACG/' |rev

某一行插入另外一个文件的内容

sed '2 r a.txt' test.csv 

对一个文件按照第一列进行筛选,筛选条件是必须在另外一个文件的第一列出现过

awk -F "," '{if(NR==FNR){count[$1]=1}else if(count[$1]==1){print $0}}' chr.txt test.csv  #将第一个文件第一列的值存入关联数组,并给值为1,如果第二个文件建立的关联数组对应值为1,说明在第一个文件第一列出现过,则输出整行

对文件第二列和第三列进行展开

展开前四列

展开后成为三列

awk -F "," '{for (i=$2;i<=$3;i++) {print $1,i,$4}}'  test.csv 

对三个文件依次merge

  这里三个文件行数相等,其中ampl列将新的和旧的染色体、位置联系起来,第一个文件将第五列(ampl列,值为ampl1,ampl2...)存入一二三列(旧染色体,旧起始位置,旧结束位置)为下标的关联数组ampl,第二个文件按照一二三列(旧染色体,旧起始位置,旧结束位置)取出关联数组的值(ampl1,ampl2...),将关联数组的值作为关联数组下标新创建关联数组Ampl,将第二个文件的值(1,2,3,4,5列,其中4、5列是我们要的信息)用sprintf生成字符串存入Ampl,第三文件按照第四列(ampl1,ampl2...),用split切割sprintf生成的字符串,取出第二个文件存入的值(这里只取出了需要的4,5列,123列的值输出第三个文件的123列(新染色体,新起始位置,新结束位置)的值)。这样Oldpanel_start_end.sort.bed 对应的旧的染色体和位置,被hg38amplicon_start_end.bed新的一个染色体和位置取代,并且将旧文件染色体和位置在amplGChg19.txt 对应的信息成功转移到新生成的新位置文件中

awk 'BEGIN{FS="\t";OFS="\t"}{if(NR==FNR){ampl[$1,$2,$3]=$5;N=NR}else if(NR<=2*N){Ampl[ampl[$1,$2,$3]]=sprintf("%s,%d,%d,%s,%s",$1,$2,$3,$4,$5);}else{split(Ampl[$4],array,",");print $1,$2,$3,array[4],array[5],$4}}' Oldpanel_start_end.sort.bed amplGChg19.txt hg38amplicon_start_end.bed | sort -k1 > hg38amplicon_Gene_GC.txt

对两个文件去重取并集

cat NewpanelGene.bed Oldpanel.gene.bed | sort -u > merge.gene.bed  #sort -u = sort | uniq ,相当于sort 之后,将重复相邻行变成只有一行

对文件按照标志开头的行进行分割

比如

 awk '/>chr/{split($0,array,">");out=array[2]};{print > out}' test.fa

输出chr1,chr2两个文件

输出文件奇数行和偶数行

sed -n 'p;n' test.txt #输出奇数行
sed -n 'n;p' test.txt #输出偶数行

统计GC含量

echo "TTCCTTGAAATAAGTGTGATT" | awk '{s=gsub("[GC]","N",$0);print s/length}'

去除windows换行符

cat test.txt | sed 's/\r//g' 

转载于:https://www.cnblogs.com/ywliao/p/7224763.html

linux 的一些脑洞操作相关推荐

  1. Linux之用户组相关操作 groupadd groupdel

    Linux之用户组相关操作  groupadd  groupdel 1. 创建用户组 命令 说明 groupadd 创建(添加)用户组 创建用户组效果图: [grep是搜索功能,详情博文:https: ...

  2. Linux之用户相关操作

    Linux之用户相关操作 1. 创建用户  [创建后会立即让设置密码] 命令 说明 useradd 创建(添加)用户 useradd命令选项: 选项 说明 -m 自动创建用户主目录,主目录的名字就是用 ...

  3. linux常用基础命令操作收集

    linux常用基础命令操作收集,以下命令基于CentOs6.x 1.日常操作命令 **查看当前所在的工作目录 pwd **查看当前系统的时间 date **查看有谁在线(哪些人登陆到了服务器) who ...

  4. Linux下对文件操作时出现乱码怎么办?

    Linux下对文件操作经常会遇见乱码问题,我在网上搜了一些解决方法,希望能对大家有所帮助. 如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题.Windows中 ...

  5. linux脚本日期时间,Linux 日期和时间操作详解

    Linux 日期和时间操作详解 发布时间:2012-11-27 15:10:07   作者:佚名   我要评论 Linux将时钟分为系统时钟(System Clock)和硬件(Real Time Cl ...

  6. Linux查看版本当前操作系统内核信息

    1. # uname -a (Linux查看版本当前操作系统内核信息) 输出 Linux xxx 4.4.0-31-generic #50~14.04.1-Ubuntu SMP Wed Jul 13 ...

  7. Linux下使用C++操作redis数据库

    Linux下使用C++操作redis数据库 文章目录 Linux下使用C++操作redis数据库 一.安装配置hiredis.h 二.接口介绍 1.**`建立链接:redisConnect`** 2. ...

  8. linux下使用python操作mysql

    linux下使用python操作mysql 文章目录 linux下使用python操作mysql 一.Python 中MySQL的几个模块对象 1.模块 2.Connection 对象 3.Curso ...

  9. linux下使用C++操作mysql

    linux下使用C++操作mysql 文章目录 linux下使用C++操作mysql 一.常用类型介绍 1. MYSQL 2. MYSQL_ROW 3. MYSQL_FIELD 4. MYSQL_RE ...

最新文章

  1. Unity中使用射线查询MeshCollider背面的方法
  2. Javascript模块规范(CommonJS规范AMD规范)
  3. java统计日志qps_【原创】基于日志增量,统计qps,并基于ip排序
  4. 英文金曲大赛_JAVA
  5. NYOJ516(优化)
  6. java 迁移数据_从迁移到Java 7的小技巧
  7. 为Tueri.io构建React图像优化组件
  8. [html] 编写一个布局,让文字环绕在图片的周围
  9. webstorm编辑器相关
  10. 诡异的dp(凸多边形分割):catalan数
  11. regionGrowth3D
  12. 使用Stream生成菜单、地区树
  13. python定义一个函数实现整数的幂运算_Leetcode练习(Python):第326题:3的幂:给定一个整数,写一个函数来判断它是否是 3 的幂次方。...
  14. centos7 安装hashcat
  15. IT技术人员的六大方向
  16. 专业技术计算机应用能力考试题库,全国专业技术人员计算机应用能力考试题库-Excel,Word,XP...
  17. 刷新率属于计算机的显示性能指标吗,显示器性能指标(菜鸟必看)
  18. 微信小程序 涉及播放视频解决办法(证书or腾讯视频插件)
  19. linux查看端口是否禁用和开启关闭端口
  20. 14、W601之AHT10温湿度传感器

热门文章

  1. 苹果系统怎么连宽带连接服务器未响应,苹果电脑怎么连宽带 MAC系统怎么连接有线宽带...
  2. 第十一章 性能与可伸缩性 Java并发编程实战 阅读总结
  3. 文学-谚语-英文谚语:英文谚语
  4. 旅行商问题(Traveling Salesman Problem,TSP)的+Leapms线性规划模型及c++调用
  5. 【学堂上新】大规模动画模拟的一种实现方法
  6. java 错误1335_安装JAVA的JDK时出现,错误1335? – 手机爱问
  7. 关于qq邮箱 该文件已达到200次的下载限制,您已不能下载该文件 的问题处理
  8. 怎么把手机中的照片做成视频?原来这么简单就可以,涨知识了
  9. 增量式旋转编码器的使用,以arduino为例
  10. Android Studio的res自动生成的文件出错了_莫韵乐与bug的奇妙冒险