1.文件合并

1.1文件上下合并

  cat f1 f2> muti  (将文件f1、f2合并成文件muti,f1在上,f2在下)

1.2左右合并

  paste f1 f2 > muti  (将文件f1、f2合并成文件muti,f1在左,f2在右,默认使用tab键隔开)

2.文件分割

2.1按行数分割

  split -l 5 file (将文件file进行分割,每个分割后的小文件,行数不大于5)

2.2按大小切割

  spilt -C 20M file (将文件file进行分割,每个分割后的文件最大为20M)

3.文件去重

3.1 可以使用sort命令

  sort -u mm(对mm文件进行排序,重复的行只取一次)

  

转载于:https://www.cnblogs.com/xudong-bupt/p/3214613.html

linux下文件合并、分割、去重相关推荐

  1. linux 文件拆分 合并,Linux下文件的切分与合并的简单方法

    linux下文件分割可以通过split命令来实现,可以将一个大文件拆分成指定大小的多个文件,并且拆分速度非常的快,可以指定按行数分割和安大小分割两种模式.Linux下文件合并可以通过cat命令来实现, ...

  2. linux下用cronolog分割apache日志

    linux下用cronolog分割apache日志,大神莫拍砖,菜鸟留一记录,小白请默默转载.连linux登陆和vi编辑都不会的,请默默关闭此页面.入正题 说明:淡绿色底的为linux命令,其他的为备 ...

  3. linux中的文件夹压缩文件,linux将文件拷贝到目录下Linux下文件的压缩与打包详解...

    在Linux中,有很多的压缩命令.利用这些压缩命令,可以方便的从网络上下载大型的文件.同时,我们知道,Linux文件的扩展名是没有特殊意义的,不过,因为Linux下存在着许多压缩命令,所以为了方便记忆 ...

  4. 实验七:掌握基本的MapReduce编程方法 (JAVA+Python实现)(编程实现文件合并和去重操作,编写程序实现对输入文件的排序,对给定的表格进行信息挖掘)

    一.实验目的: 1. 理解MapReduce的工作机制: 2. 掌握基本的MapReduce编程方法 3. 重点理解map过程,shuffle过程和reduce过程 二.实验环境: Hadoop+Ec ...

  5. linux下文件字符集转化实战篇

    linux下文件字符集转化实战篇 ------------------------------------------ 为什么转换编码,起因:分析应用程序日志,文件编码格式gb2312(含中文字符), ...

  6. Linux下文件的三种时间戳

    Linux下文件的三种时间标记 三种时间对应关系表 column column column 访问时间 Access atime 修改时间 Modify mtime 状态改动时间 Change cti ...

  7. linux下文件的压缩和解压缩

    linux下文件的压缩和解压缩 目录 1.压缩 2.解压缩 3.归档工具 一. 压缩 compress: -d:解压缩,相当于uncompres-c:结果输出至标准输出,不删除原文件-v:显示详情 - ...

  8. Linux下文件的三个时间:ctime、mtime、atime的区别

    Linux下文件的三个时间参数 (1)modification time(mtime):内容修改时间 这里的修改时间指的是文件的内容发生变化,而更新的时间. Eg:vi后保存文件. (2)status ...

  9. Unix/Linux下文件基本操作[zt]

    Unix/Linux下文件基本操作 来源: ChinaUnix博客 日期: 2008.06.16 17:16 (共有0条评论) 我要评论 比较重要的设备文件有三个,它们是/dev/console./d ...

最新文章

  1. 详解 Tomcat 的连接数与线程池
  2. [转]ArcGIS.Server.9.3和ArcGIS API for Flex实现Query查询定位中心功能(七)
  3. python【力扣LeetCode算法题库】6-Z 字形变换
  4. 基于OHCI的USB主机 —— 寄存器(其它)
  5. 北京内推 | 微软亚洲研究院DKI组王露研究员招聘强化学习方向研究实习生
  6. CentOS7安装VirtualBox
  7. ureport2 + spring boot 搭建
  8. 我就是一根儿筋 也许问题很简单
  9. Dirichlet Process 和 Dirichlet Process Mixture模型
  10. 2020年度SaaS企业 TOP100
  11. c语言 程序设计 题库答案 p,c语言 程序设计 题库答案 p
  12. windows 使用docker构建镜像
  13. 如何使用机器学习在一个非常小的数据集上做出预测
  14. html显示tooltips,提示工具 | Tooltips
  15. 开心网kaixin001状告kaixin,停用“开心网”名称,赔偿1000万元
  16. 解决Windows更新失败(0x8007000d)的详细方法
  17. 华为服务器怎么查看系统日志,云服务器怎么查看系统日志
  18. 高通SIMLOCK研究
  19. DSP之Controlsuit和C2000Ware下载安装
  20. web服务器利用线程响应http请求,多线程实现的HTTP应用服务器(HTTPWebServer)Mutu 0.2 alpha连载I...

热门文章

  1. Macbook Pro 光驱坏 安装windows
  2. 用c#控制台模拟双色球随机选
  3. 服务器控件开发之复杂属性
  4. 发现读纸质媒介比电子媒介的乐趣大多了
  5. Storm集群使用DRPC功能Version1.0.1
  6. [蓝桥杯]2018年第九届省赛真题C/C++ B组 填空+大题
  7. JDK的下载、安装和配置
  8. 定个小目标,炒股咯....
  9. Elasticsearch Scale Out
  10. 浅谈,JavaScript 运行机制和Event Loop