生物信息之独孤九剑——sort
编者按:
在金庸武学体系的众多武功之中,独孤九剑并不是最强劲的武功,它与其他武林绝学有很大的不同,可以说是鹤立鸡群。比如乔峰的降龙十八掌,段誉的六脉神剑,张无忌的九阳神功,石破天的罗汉伏魔神功,这些神功都需要强大的内力支撑,而独孤九剑则不同,不需要内力,这点其实可以从华山派气宗与剑宗的分歧就可以看出来。独孤九剑传人风清扬属于剑宗,更注重招式,而不是像剑宗注重练气。独孤九剑分为总诀式,破剑式,破刀式,破枪式,破鞭式,破索式,破箭式,破掌式,破气式,遇到不同的场景使用关不同的招式,因此,独孤九剑更加注重问题的解决,本质上就是就是通过工具来解决问题。只要学会这九剑,就可以处理很多的问题。学习生物信息也是同样的道理,当然练好内功,掌握很好的基础是非常必要的,但是也可以学习一些小工具,解决一些实际问题。那么从这次内容开始,我们就来给大家介绍生物信息之独孤九剑。
文本排序是计算机编程中非常重要的一项工作,排序之后的数据更加具有规律,并且更方便处理。在生物信息分析中排序也是非常重要的工作,我们常常需要根据基因组的坐标位置进行排序,例如在利用短序列比对进行变异检测的过程中, 首先就需要进行排序,例如bwa比对之后,利用samtools对bam结果进行排序,然后才能进行后续的分析。在Linux系统中,可以使用sort工具对文本文件内的内容进行排序
排序主要可以分为三种情况:
第一种:根据数字大小进行排序,例如根据坐标位置大小进行排序,根据比对的分值大小排序结果;
第二种:根据根据字符大小进行排序,比如abcdef这种顺序;
第三种:给定一个文件,里面包含了指定的顺序。
案例一:直接排序;
sort
案例二:按相反顺序进行排序;
sort -r
案例三:根据数字大小进行排序;
sort -n
案例四:排序去除重复;
sort -u
案例五:多条件排序;
sort -nrk3 -k2 #首先按照第三列进行排序,然后按照第2列进行排序;
案例六:统计blast比对上的序列数目;
awk '{print $1} ’ blast.out | sort -n | uniq | wc
更多内容,欢迎订阅微信公众号:基因学苑
生物信息之独孤九剑——sort相关推荐
- sed 替换_生物信息之独孤九剑——sed
编者按: 在金庸武学体系的众多武功之中,独孤九剑并不是最强劲的武功,它与其他武林绝学有很大的不同,可以说是鹤立鸡群.比如乔峰的降龙十八掌,段誉的六脉神剑,张无忌的九阳神功,石破天的罗汉伏魔神功,这些神 ...
- 生物信息之独孤九剑——sed
编者按: 在金庸武学体系的众多武功之中,独孤九剑并不是最强劲的武功,它与其他武林绝学有很大的不同,可以说是鹤立鸡群.比如乔峰的降龙十八掌,段誉的六脉神剑,张无忌的九阳神功,石破天的罗汉伏魔神功,这些神 ...
- 生物信息之独孤九剑——cut
今年到目前写了不少内容,本来想写专题的,而且已经写了两个了,一共写了40篇.结果突然有一天发现,两年前写的一个专题还没有写完.本来要写一个生物信息之独孤九剑,结果只写了七篇,后来居然忘了继续更新,变成 ...
- 生物信息百Jia软件(七):glimmer
编者按 欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘! 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源,也介绍了<生物信息之独 ...
- 生物信息百Jia软件(六):prodigal
编者按 欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘! 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源,也介绍了<生物信息之独 ...
- 生物信息百Jia软件(十七):flash
欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 编者按 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源 ...
- 基因课 15天入门生物信息(2021年) 第三天 Linux基础命令(3)
15天入门生物信息(2021年)15天入门生物信息(2021年)_哔哩哔哩_bilibili atha.fasta的前10行 打印出来 head -n 10 atha.fasta atha.fast ...
- 文件夹内的文本行数_重温生物信息重要的文本处理命令(实例命令及解释)
linux文本处理命令是一类对文件进行操作的命令,通过使用文本处理命令,可以轻松的对文件进行排序,拆分,合并等操作,熟练掌握文本处理命令,在生物信息文本处理中,有十分重要的意义. 01 cat 查看文 ...
- 生物信息常用30个Linux命令(二)
学习生物信息,Linux是必须掌握的内容,其实常用的Linux命令也就30个左右,而且这些命令都是单词的简写,记忆起来并不困难.从这次内容开始,我们将详细介绍这30个左右的命令. 11.cat cat ...
- 初探生物信息数据库——生信原理第一次实验报告(华农)
初探生物信息数据库--生信原理第一次实验报告(华农) 1 实验目的 熟悉NCBI数据库Entrez检索系统,会使用关键词检索NCBI.UnitProtKB.PubMed等数据库,能理解检索结果页面各条 ...
最新文章
- org.apache.tomcat.util.bcel.classfile.ClassFormatException: Invalid byte tag in constant pool: 60
- 关于JavaScript相关文章
- 微信腾讯会议进行视频面试,如何使用腾讯会议进行视频面试?
- Android Studio的gradle项目构建
- springboot yml怎么建常量_Springboot中加载自定义的yml配置文件
- 时区日期处理及定时 (NSDate,NSCalendar,NSTimer,NSTimeZone)
- D. Steps to One(概率DP,莫比乌斯反演)
- java jsp学习指南_JSP教程–最终指南
- Favorites整理v2011
- 用 Python 的 selenium扩展 驱动 火狐 谷歌 浏览器
- Python调用Cplex:安装,测试,实例
- CEBIT首现移动电子硬盘,大小如名片
- 互联网电商数据分析常用的指标
- linux c语言怎么把2个字符串拼起来,【C语言学习笔记】字符串拼接的3种方法 .
- 跳跃游戏Ⅱ(C语言)
- 深度评测 极米z6x和z6哪个好 极米z6和z6x区别
- precision 为什么和recall成反比
- PhotoShop批量生成App大小不同的Icon
- 拥有奇瑞QQ冰淇淋·桃欢喜才懂的幸福
- 使用docker急速搭建Oracle测试环境(完全离线)