使用awk处理多行fasta文件拆分为单个fasta文件,并去掉后缀^M
大文件:31万个序列(我看的文章里面说一小时处理100条序列,这里我用了半个小时)
代码如下:把mulfa.fasta文件拆分成单个fasta文件
awk '{if($0~/^>/)a=$0; else{system("echo \\"a"\"\n\""$0a)}}' mulfa.fasta
mulfa.fasta文件如下:
生成的单个fasta文件如下:
小文件处理及代码解释如这篇文章所说:http://t.csdn.cn/xTZId
感谢这位大佬
使用上述命令生成单个fasta文件后,在linux里很有可能会出出现一个问题,就是文件名最后会多出两个字符“^M”,这是由于windows和linux系统中换行符不一样所导致的,如下图所示,正确的id名后显示一个问号,使用tab键补齐时显示^M。
参考这位博主的文章:http://t.csdn.cn/sxPXK
在单个fasta文件夹下,运行下述代码,即可。
#!/bin/sh
fall=$(du -a|awk '{print $2}')
count=0
for dirfile in $fall;
docount=$(($count+1))if [ -d $dirfile ]; thendirfile2=$dirfile/for ffile in $(ls $dirfile);doffile2=$ffilemm=$(echo $ffile2|tr -d "\r")if [ "$ffile" != "$mm" ];thenmv $dirfile2$ffile $dirfile2$mm;fidonefi
done
使用awk处理多行fasta文件拆分为单个fasta文件,并去掉后缀^M相关推荐
- Python脚本:将mol2分子库文件拆分为单个mol2文件
如题:将mol2分子库文件拆分为单个mol2文件 用法: python split_multimol2.py multi-mol2.mol2 out_dir 注释:python 脚本文件 mol2分子 ...
- 怎么将PDF文件拆分成多个文件?2个方法帮你搞定
PDF格式在日常办公学习中经常被使用,因为它不仅易于阅读和浏览,而且文件大小相对较小,兼容性也很强.然而,有时候当PDF文件内容较多时,找到文件中重要内容可能会变得困难.为了解决这个问题,我们可以尝试 ...
- linux 文件拆分 合并,Linux下文件的切分与合并的简单方法
linux下文件分割可以通过split命令来实现,可以将一个大文件拆分成指定大小的多个文件,并且拆分速度非常的快,可以指定按行数分割和安大小分割两种模式.Linux下文件合并可以通过cat命令来实现, ...
- 将PDF文件拆分成多个文件的教程
毕业的大学生都要写论文,这是很重要的一个环节,但是论文不像我们平时编辑资料一样,只要差不多就可以交,但是论文不一样.我们到网上采集资料的时候,都是都是PDF格式的文件偏多,所以我们的就很苦恼,下载之后 ...
- 批量将多个 PPT 幻灯片文件合并成单个 PPT 文件
概要:我们经常处理 PPT 幻灯片文件,有时候我们有很多个 PPT 幻灯片文件需要整理.最常见的需求就是我们需要批量的将多个 PPT 幻灯片文件合并成一个独立的 PPT 文件,这个时候该怎么办呢?如果 ...
- idea打开java文件_IDEA运行单个Java文件
对于某些Java示例可能是只有单个文件,并不是完整的Java工程,那么要如何运行单个Java文件呢,以IDEA为例. 我的环境: IDEA 2017.3.2 jdk 1.8.0.73 操作步骤: 1. ...
- php txt 下载文件,PHP下载单个TXT文件
前端传递参数: 下载TXT PHP处理 function downfile($fileurl) { $filename=$fileurl; // 文件的保存路径 $example_name= ...
- Excel表格按行数拆分为多个文件
此代码只适用微软的Office Excel软件,WPS软件没有测试,而且WPS宏代码是收费功能. 在Excel菜单点击[开发工具]-[查看代码]进入VBA代码编写界面,然后点击[插入]-[模块],把下 ...
- 如何在另一个JavaScript文件中包含一个JavaScript文件?
JavaScript中是否有类似于CSS中@import的内容,可让您在另一个JavaScript文件中包含一个JavaScript文件? #1楼 而不是在运行时添加,而是使用脚本在上传之前进行串联. ...
最新文章
- Python正则表达式之编译正则表达式(2)
- 如何 SSH 到 Linux 服务器里的特定目录及执行命令?
- Performance Tuning
- 【翻译】YARN Architecture
- C语言数据结构知识点小结(全)
- 浏览器HTML5 写入文件
- linux系统vim程序编译器,linux学习日记七 vim程序编辑器使用
- 设计模式学习(十七) 观察者模式 Observer
- Docker基础30--6.4 Docker三剑客之Swarm
- 文档在线查看功能的实现
- java eav模式_Magento 2中EAV模型的理解
- 阿包也是兔娘cosplay全套超清图包合集
- Could not find apk!终于解决了! 坐在我旁边的领导帮我弄的~~ 大家谢谢他吧~~
- Java实现简单的KFC点餐系统(未实现可视化)
- idea 制作maven脚手架_开发一个maven脚手架
- Within-sample variability-invariant loss for robust speaker recognition under noisy environments
- 2022年全球在线招聘软件行业分析报告
- 中专财务计算机课程都有,会计中职学什么
- 搭建个人网站--搭建网站
- 排序算法及其时间复杂度