use tools for extracting ,analyzing and manipulating text data

使用提取、分析和处理文本数据的工具


全文阅读

  cat:直接抓取文件,一次性输出

  less:分屏工具 (上下键,pageup pagedown,:搜索关键字,退出q) man帮助使用的而是less

  more:只能向下分屏显示

指定位置

  head :默认显示前10行   nl 给输出的信息添加行号

    head -n 11 /etc/passwd

  tail:默认显示文件的最后10行   // tail -f  (追踪文件追加的内容)

    tail -n 17 /etc/passwd


grep :过滤,以行为单位
    -w :单词
    -i :忽略大小写   计算机识别是通过ascii码
    -n :显示关键字在哪一行
    -v :取反
    -Ax:显示关键字后X行
    -Bx:显示关键字前x行
    -r :递归查询
    --color:  alias别名  系统自带了添加颜色
dmidecode 查看系统硬件信息
dmidecode |grep A10   过滤关键字下面的10行

cut:竖切
    cut -d: -f1 /etc/passwd  :以:为分隔符切出来第一列
    cut -c1-5 /etc/passwd  :按字符来切
    
    ifconfig br0 |grep -w inet |cut -d\  -f3   :\转意符
    ifconfig br0 |grep -w inet |awk {'print $2'}
    
    
wc:统计
行 单词 字符
    -l:行
    -c:字符
    -m:字节
    
sort:排序
    -r:反向排序
    -n:
    -f:
    -u:取唯一值
    -t:分格符
    -k:
uniq :取唯一值(相邻行之间的比较)
  cat abc |sort |uniq  -c  先排序后排出,最后统计

diff :比较不同 (行级)
  diff  /tmp/abc  /tmp/def

tr and sed
    tr ‘a-z’ 'A-Z' < lowercase.txt
    
sed :查找与替换
    sed 's/dog/cat/g' pets   //全局查找dog并且替换成cat
    sed '1,50s/dog/cat/g' pets  //1-50行 全局查找dog并且替换成cat
    sed '/digby/,/duncan/s/dog/cat/g' pets  //两个关键字之间的搜索替换


作业

1、截取系统中所有网卡的IP  和MAC
2、截取后的结果要求放到指定的文件中,所有的网卡信息应当放到/data/net(每个网卡一个文件)
3、文件名的命名方式为 主机名-网卡名
4、该动作应当使用脚本执行
5、要求该脚本可移植
6、本地回环接口除外

#!/bin/bash

#for cut IP and MAC

NAME=$(ifconfig |grep flags |grep -v lo |cut -d: -f1)

DIR=/data/ent

  for NET in $NAME

    do

      mkdir -r $DIR

      IPADDR=$(ifconfig $NAME |grep -w inet|awk {'print $2'})

      MAC=$(ifconfig $NAME |grep -w ether |awk {'print $2'})

      HOST=$(hostname)

      echo $IPADDR >>  $DIR/$HOST-$NAME

      echo $MAC >> $DIR/$HOST-$NAME

    done

  

      

转载于:https://www.cnblogs.com/ydfq/p/7016679.html

第八章:文本处理工具相关推荐

  1. Kali Linux 网络扫描秘籍 第八章 自动化 Kali 工具

    第八章 自动化 Kali 工具 作者:Justin Hutchens 译者:飞龙 协议:CC BY-NC-SA 4.0 Kali Linux 渗透测试平台提供了大量高效的工具,来完成企业渗透测试中所需 ...

  2. NLP文本标注工具与平台(数据标注公司)

    最近在做NLP相关项目,包括句法分析.情感分析等,有大量数据需要标注.我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考. 文本标注平台(标注外包公司) 数据标注公司的工作 ...

  3. Linux命令:文本处理工具awk详解

    awk命令简介: awk是一个强大的文本分析工具,通常,awk是以文件的每一行,为处理单位的.awk每接收文件的一行,然后执行相应的命令,来处理文本.  1.命令格式: awk 'pattern {a ...

  4. 文本处理工具之grep和egrep

    文本处理工具之grep和egrep grep全称global search regular expression (RE) and print out the line 正则表达式(一类字符所书写的模 ...

  5. 【Linux】 字符串和文本处理工具 grep sed awk

    Linux字符串&文本处理工具 因为用linux的时候主要用到的还是字符交互界面,所以对字符串的处理变得十分重要.这篇介绍三个常用的字符串处理工具,包括grep,sed和awk ■ grep ...

  6. python3.6运行界面_python3.6 +tkinter GUI编程 实现界面化的文本处理工具

    更新: 2017.07.17 补充滚动条.win批处理拉起py 2017.08.13 新增自定义图标 --------原创 blogs: http://www.cnblogs.com/chenyueb ...

  7. Linux文本搜索工具grep

    简介 grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文件内容,并把域值所匹配的行打印出来 grep命令语法结构 grep [options] '要搜索的字符串' filename gre ...

  8. 怎样构建中文文本标注工具?(附工具、代码、论文等资源)

    来源:Paperweekly 本文长度为2218字,建议阅读4分钟 本文为你介绍中文文本标注工具的构建方法,并提供多个开源文本标注工具. 项目地址: https://github.com/crownp ...

  9. python 图形界面文本处理_python3.6 +tkinter GUI编程 实现界面化的文本处理工具

    一.背景: 1.工作中自己及同事在查数据库.测试接口时需要对一些字符串或json串作预处理,目前这些问题网上均有在线转换的工具,但很繁杂,可能需要打开几个网页窗口: 2.之前给妹子做的文本处理工具(h ...

  10. 文本转化工具dos2unix

    文本转化工具dos2unix 由于历史原因,各个平台使用的文本编码规范不同,导致了同一文本在不同平台中显示不同.例如,Windows和Linux的换行符号不同,会造成多行文本显示混乱.为了解决这个问题 ...

最新文章

  1. 第二十章:异步和文件I/O.(十三)
  2. 未能加载文件或程序集 ICSharpCode.SharpZipLib
  3. Linxu的常用命令
  4. 谷歌退出中国几成定局 谈判已谈崩
  5. 計算機二級-java-03
  6. leetcode971. Flip Binary Tree To Match Preorder Traversal
  7. C语言八位彩灯循环左移,利用计数器和移位寄存器设计一个八个彩灯循环电路?...
  8. 一些比较隐秘的OJ的网址
  9. bzoj4567: [Scoi2016]背单词
  10. Source Code Pro一款堪称完美的编程字体
  11. 阿里云购买域名,以及域名备案(ICP备案)(网站备案)和公安备案(公安联网备案)
  12. av_rescale_q和av_rescale_q_rnd和av_rescale_rnd
  13. 软件解耦(decouple)
  14. Android常用控件-02
  15. 网站源码 HTML和源代码有什么区别?他俩是什么关系?
  16. 海信E5K电视怎么样,海信E5K 65、75、100英寸选哪个好
  17. Android加载图片导致内存溢出(Out of Memory异常)
  18. 从零开始学matplotlib画图(一): 极速上手
  19. 光谱特征选择---随机蛙跳变量选择RF
  20. 全景图的获取以及HTML页面显示全景图

热门文章

  1. VB中窗体模块、标准模块、类模块的区别
  2. 错误:找不到或无法加载主类
  3. 解读Scorm(0):标准
  4. MyBatis SQL注入隐患及防范
  5. Quartz2D绘制路径
  6. SQL查询集合合并成字符串
  7. 处理PHP字符串的10个简单方法
  8. 健康生活--16个健康习惯
  9. day12 生成器和各种推导式
  10. 开发运维日常坑 总结 51-100