linux搜索word文档内容,在目录中搜索MS word文件以获取Linux中的特定内容
我有一个充满MS word文件的目录结构,我必须在目录中搜索特定的字符串.到目前为止,我使用以下命令在目录中搜索文件
find . -exec grep -li ‘search_string’ {} \;
find . -name ‘*’ -print | xargs grep ‘search_string’
但是,此搜索不适用于MS word文件.
是否可以在Linux中的MS word文件中进行字符串搜索?
解决方法:
我是一名翻译,并且几乎不知道脚本编写,但我很生气,因为grep无法扫描Word .doc文件,我研究了如何使这个小shell脚本使用catdoc和grep来搜索目录.doc文件的给定输入字符串.
您需要安装catdocand docx2txt包
#!/bin/bash
echo -e "\n
Welcome to scandocs. This will search .doc AND .docx files in this directory for a given string. \n
Type in the text string you want to find... \n"
read response
find . -name "*.doc" |
while read i; do catdoc "$i" |
grep --color=auto -iH --label="$i" "$response"; done
find . -name "*.docx" |
while read i; do docx2txt < "$i" |
grep --color=auto -iH --label="$i" "$response"; done
欢迎所有改进和建议!
标签:linux,unix,ms-word
来源: https://codeday.me/bug/20191006/1860465.html
linux搜索word文档内容,在目录中搜索MS word文件以获取Linux中的特定内容相关推荐
- word根据目录切块php,PHP导出Word文档如何自定义目录?
PHP导出Word文档如何自定义目录? 2018-09-19 class word { function start() { ob_start(); } function save($path) { ...
- word文档添加多级目录,自动生成目录
word文档添加多级目录 转载:http://jingyan.baidu.com/article/8ebacdf0c32c5f49f65cd53f.html Word如何添加一级二级标题等多级标题 有 ...
- word文档的左侧目录被隐藏了,怎么显示?
word文档的左侧目录被隐藏了,怎么显示? 解决方法: 注意:某title要在左侧目录现实就得设置为标题先. 视图-->http://www.yayihouse.com/yayishuwu/ch ...
- word html密码,Word文档加密打不开怎么办?Word解除密码的三种解决办法
今天总结一下对Word文档解除密码保护的三种方法,如下: 方法一:文件另存法 打开受保护的文档,依次单击"文件→另存为",弹出"另存为"对话窗口,在" ...
- Py自动化办公—Word文档替换、Excel表格读取、Pdf文件生成和Email自动邮件发送实战案例...
点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 平阳歌舞新承宠,帘外春寒赐锦袍. ...
- word文档docx密码忘了怎么办,word文档docx权限限制怎么办?
word文档docx移除编辑密码,word文档docx权限限制如何解除?[解密神器]word文档docx权限密码解密,用「密码帝」啊 超级好用!,百度搜索密码帝就可以了,非常简单手机电脑都可以用,一键 ...
- java根据html生成word文档,Java之HTML富文本导出WORD(不含图片)
一.需求: 我们在使用富文本编辑器来编辑文本的时候,文本会自带HTML的标签比如 等来修饰字体样式. 比如ueditor.kindeditor等富文本编辑器. 那么,我们如何将富文本编辑器里的内容导出 ...
- word文档打印预览有阴影_在打印预览中编辑Word文档
word文档打印预览有阴影 While viewing a Word document in the Print Preview window, you might notice a typo, or ...
- web系统中巧用word文档的html格式创建多样式的word文档,WEB系统中巧用WORD文档的HTML格式创建多样式的WORD文档...
以计算机和现代网络技术为特征的现代信息技术极大地促进了社会经济的发展,基于各行各业的WEB系统的开发与应用也越来越多. >> WEB系统中巧用WORD文档的HTML格式创建多样式的WORD ...
- python win32转pdf 横版_使用Python3将word文档和pdf电子书进行格式互转(兼容Windows/Linux)...
一些重要文档格式之间的互转在目前显得尤为重要,pdf作为通用格式在现在各个平台上兼容性是最好的,所以写python脚本将这些word文档批量转换pdf是最好的解决方案. 由于windows系统对于wo ...
最新文章
- 【CVPR2020来啦】不容错过的29个教程Tutorial !(附Slides下载链接)
- gcc和g++的区别
- 第一次冲刺个人博客07
- Servlet的重定向和转发特点
- mongoose更新数据,如果这条记录不存在,则直接变为新增
- git本地分支删除,代码没了!怎么恢复!亲测有效(吓死人了)
- AD-批量启用账户命令 Enable-adaccount
- mybatis注解开发_Spring Boot 中集成 MyBatis
- vscode-icons插件使用
- 网站的服务器怎么维护,网站服务器怎么维护
- Kotlin入门(25)共享参数模板
- QRegExpValidator
- 输出源文件的标题,目前执行行的行数,编译时间
- springboot集成rocketmq
- php wps 读取word内容,PHP中读取,写入和导出WORD文档的代码总结
- php 获取月份的周数,PHP获取当前月份的周数只能使用php
- 微应用 qiankun 项目搭建
- 2021世界燕窝展|上海滋补品展谈孕期燕窝六问
- Canvas---文字的绘制
- 随笔——网易云的神评论(持续更新)
热门文章
- l298n电机哪一端为正_L298N是如何控制直流电机正反转的
- Elasticsearch自动补全(拼音查询自动补全)
- linux系统可以安装Adobe,Ubuntu 64位安装Adobe Reader 9.5.5
- Linux驱动开发(硬件基础)——处理器
- Excel常用统计分析函数分享
- 2021WordPress转z-blog搬家教程_WordPress搬家zblog博客程序工具
- html中半透明效果,CSS半透明效果的属性和场景
- javaweb课程设计之XXX管理系统
- 软件工程理论与实践第二版吕云翔课后习题答案
- Halcon的一维码和二维码解码步骤和技巧