第八章:文本处理工具
use tools for extracting ,analyzing and manipulating text data
使用提取、分析和处理文本数据的工具
全文阅读
cat:直接抓取文件,一次性输出
less:分屏工具 (上下键,pageup pagedown,:搜索关键字,退出q) man帮助使用的而是less
more:只能向下分屏显示
指定位置
head :默认显示前10行 nl 给输出的信息添加行号
head -n 11 /etc/passwd
tail:默认显示文件的最后10行 // tail -f (追踪文件追加的内容)
tail -n 17 /etc/passwd
grep :过滤,以行为单位
-w :单词
-i :忽略大小写 计算机识别是通过ascii码
-n :显示关键字在哪一行
-v :取反
-Ax:显示关键字后X行
-Bx:显示关键字前x行
-r :递归查询
--color: alias别名 系统自带了添加颜色
dmidecode 查看系统硬件信息
dmidecode |grep A10 过滤关键字下面的10行
cut:竖切
cut -d: -f1 /etc/passwd :以:为分隔符切出来第一列
cut -c1-5 /etc/passwd :按字符来切
ifconfig br0 |grep -w inet |cut -d\ -f3 :\转意符
ifconfig br0 |grep -w inet |awk {'print $2'}
wc:统计
行 单词 字符
-l:行
-c:字符
-m:字节
sort:排序
-r:反向排序
-n:
-f:
-u:取唯一值
-t:分格符
-k:
uniq :取唯一值(相邻行之间的比较)
cat abc |sort |uniq -c 先排序后排出,最后统计
diff :比较不同 (行级)
diff /tmp/abc /tmp/def
tr and sed
tr ‘a-z’ 'A-Z' < lowercase.txt
sed :查找与替换
sed 's/dog/cat/g' pets //全局查找dog并且替换成cat
sed '1,50s/dog/cat/g' pets //1-50行 全局查找dog并且替换成cat
sed '/digby/,/duncan/s/dog/cat/g' pets //两个关键字之间的搜索替换
作业
1、截取系统中所有网卡的IP 和MAC
2、截取后的结果要求放到指定的文件中,所有的网卡信息应当放到/data/net(每个网卡一个文件)
3、文件名的命名方式为 主机名-网卡名
4、该动作应当使用脚本执行
5、要求该脚本可移植
6、本地回环接口除外
#!/bin/bash
#for cut IP and MAC
NAME=$(ifconfig |grep flags |grep -v lo |cut -d: -f1)
DIR=/data/ent
for NET in $NAME
do
mkdir -r $DIR
IPADDR=$(ifconfig $NAME |grep -w inet|awk {'print $2'})
MAC=$(ifconfig $NAME |grep -w ether |awk {'print $2'})
HOST=$(hostname)
echo $IPADDR >> $DIR/$HOST-$NAME
echo $MAC >> $DIR/$HOST-$NAME
done
转载于:https://www.cnblogs.com/ydfq/p/7016679.html
第八章:文本处理工具相关推荐
- Kali Linux 网络扫描秘籍 第八章 自动化 Kali 工具
第八章 自动化 Kali 工具 作者:Justin Hutchens 译者:飞龙 协议:CC BY-NC-SA 4.0 Kali Linux 渗透测试平台提供了大量高效的工具,来完成企业渗透测试中所需 ...
- NLP文本标注工具与平台(数据标注公司)
最近在做NLP相关项目,包括句法分析.情感分析等,有大量数据需要标注.我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考. 文本标注平台(标注外包公司) 数据标注公司的工作 ...
- Linux命令:文本处理工具awk详解
awk命令简介: awk是一个强大的文本分析工具,通常,awk是以文件的每一行,为处理单位的.awk每接收文件的一行,然后执行相应的命令,来处理文本. 1.命令格式: awk 'pattern {a ...
- 文本处理工具之grep和egrep
文本处理工具之grep和egrep grep全称global search regular expression (RE) and print out the line 正则表达式(一类字符所书写的模 ...
- 【Linux】 字符串和文本处理工具 grep sed awk
Linux字符串&文本处理工具 因为用linux的时候主要用到的还是字符交互界面,所以对字符串的处理变得十分重要.这篇介绍三个常用的字符串处理工具,包括grep,sed和awk ■ grep ...
- python3.6运行界面_python3.6 +tkinter GUI编程 实现界面化的文本处理工具
更新: 2017.07.17 补充滚动条.win批处理拉起py 2017.08.13 新增自定义图标 --------原创 blogs: http://www.cnblogs.com/chenyueb ...
- Linux文本搜索工具grep
简介 grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文件内容,并把域值所匹配的行打印出来 grep命令语法结构 grep [options] '要搜索的字符串' filename gre ...
- 怎样构建中文文本标注工具?(附工具、代码、论文等资源)
来源:Paperweekly 本文长度为2218字,建议阅读4分钟 本文为你介绍中文文本标注工具的构建方法,并提供多个开源文本标注工具. 项目地址: https://github.com/crownp ...
- python 图形界面文本处理_python3.6 +tkinter GUI编程 实现界面化的文本处理工具
一.背景: 1.工作中自己及同事在查数据库.测试接口时需要对一些字符串或json串作预处理,目前这些问题网上均有在线转换的工具,但很繁杂,可能需要打开几个网页窗口: 2.之前给妹子做的文本处理工具(h ...
- 文本转化工具dos2unix
文本转化工具dos2unix 由于历史原因,各个平台使用的文本编码规范不同,导致了同一文本在不同平台中显示不同.例如,Windows和Linux的换行符号不同,会造成多行文本显示混乱.为了解决这个问题 ...
最新文章
- 第二十章:异步和文件I/O.(十三)
- 未能加载文件或程序集 ICSharpCode.SharpZipLib
- Linxu的常用命令
- 谷歌退出中国几成定局 谈判已谈崩
- 計算機二級-java-03
- leetcode971. Flip Binary Tree To Match Preorder Traversal
- C语言八位彩灯循环左移,利用计数器和移位寄存器设计一个八个彩灯循环电路?...
- 一些比较隐秘的OJ的网址
- bzoj4567: [Scoi2016]背单词
- Source Code Pro一款堪称完美的编程字体
- 阿里云购买域名,以及域名备案(ICP备案)(网站备案)和公安备案(公安联网备案)
- av_rescale_q和av_rescale_q_rnd和av_rescale_rnd
- 软件解耦(decouple)
- Android常用控件-02
- 网站源码 HTML和源代码有什么区别?他俩是什么关系?
- 海信E5K电视怎么样,海信E5K 65、75、100英寸选哪个好
- Android加载图片导致内存溢出(Out of Memory异常)
- 从零开始学matplotlib画图(一): 极速上手
- 光谱特征选择---随机蛙跳变量选择RF
- 全景图的获取以及HTML页面显示全景图