Word文档到Asciidoc转换
原文
Word文档的内容,需要背转换为Asciidoc。以下是我发现最有效的步骤:
1. 将Word文档保存为HTML
2. 编码为UTF-8
3. 使用pandoc将HTML转换为AsciiDoc
4. 使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西
5. 使用Sublime Text 2执行任何剩余的格式
将Word文档保存为HTML
在Word中打开文档,然后另存为网页。保存时选择“仅保存显示信息到HTML”选项。从Word退出。
编码为UTF-8
在Sublime Text 2中打开html文件。重新打开UTF-8编码并保存文件:
Sublime Text 2重新打开编码
如果不重新编码为UTF-8,则下一步将失败并显示错误:
pandoc:无法解码字节’\ x6f’:Data.Text.Encoding.decodeUtf8:无效的UTF-8流
使用Pandoc将HTML转换为AsciiDoc
运行Pandoc。例如,以下命令将AsciiDoc文件file.asc转换为ConventionSheet.htm:
pandoc -f html -t asciidoc -o file.asc ConventionSheet.htm
使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西
奇怪的单引号需要去:
Sublime Text 2用单引号替换反引号,如果在Word中进行了审核,则审阅者的评论和更改可能会出现在HTML中。使用搜索删除这些,并在搜索字段中替换以下正则表达式:
\[line-through\]\*(.+)\*
当匹配行交叉线断裂时,可以使用?s正则表达式中的单行选项()进行搜索和替换:
(?s)\[line-through\]\*.(.*?)\*
使用Sublime Text 2执行任何剩余的AsciiDoc格式
在文档中等间隔任何正则表达式或其他特殊字符(这些将导致AsciiDoc解析器的问题)。
根据需要编辑AsciiDoc文档!请注意,GitHub现在本地显示AsciiDoc文件(在幕后使用AsciiDoctor),就像Markdown一样。
Word文档到Asciidoc转换相关推荐
- asciidoc转换html,Word文档到Asciidoc转换
原文 Word文档的内容,需要背转换为Asciidoc.以下是我发现最有效的步骤: 1. 将Word文档保存为HTML 2. 编码为UTF-8 3. 使用pandoc将HTML转换为AsciiDoc ...
- wps的ppt怎么存html,如何将网页快速转换为WPS与WORD文档 ppt怎么转换成word文档
导读:小编根据大家的需要整理了一份关于<如何将网页快速转换为WPS与WORD文档 ppt怎么转换成word文档>的内容,具体内容: 看到图文并茂的网页,想把它全部或部分转换为WPS或者WO ...
- Java——EasyPoi导出word文档,itextpdf转换pdf
EasyPoi导出word文档,itextpdf转换pdf 文章目录 EasyPoi导出word文档,itextpdf转换pdf 前言 一.依赖 二.工具类 1.WordUtil 2.PDF工具类 3 ...
- html 转word c#,c#操作word类,进行html和word文档的互相转换
#region 把Word文档装化为Html文件 /** ///把Word文档装化为Html文件/// /// 要转换的Word文档 public static void WordToHtml( st ...
- word文档doc格式转换成docx
把doc格式转换成docx jar包下载 //把doc格式转换成docx//导入 Spire.Doc.jarDocument d = new Document("F:\\**\\**\\云想 ...
- html格式图片可以转换成word文档,html网页转换成word文档,转换成功,并且可以保存图片,但是总是为web版式的格式,怎么改成“页面”格式,多谢...
当前位置:我的异常网» C# » html网页转换成word文档,转换成功,并且可以保存图 html网页转换成word文档,转换成功,并且可以保存图片,但是总是为"web版式"的格 ...
- 怎么把php转变成word文档,表格怎么转换成word文档
转换方法:1.打开excel表格,点击"文件"-"另存为":2.保存类型设置为"单个网页类型",点击"选择工作表",点击 ...
- python html转word文档_Python实现将HTML转换成doc格式文件的方法示例
本文实例讲述了Python实现将HTML转换成doc格式文件的方法.分享给大家供大家参考,具体如下: 网页上的一些文章,因为有格式的原因,它们在网页上的源码都是带有html标签的,用css来进行描述. ...
- 使用java将word文档docx,doc(包含图形,文本框)完美转换成所有格式图片(pdf,png,gif,jpeg等等)
使用java将word文档docx,doc(包含图形,文本框,图片等)完美转换成所有格式图片(pdf,png,gif,jpeg等等)下文中附带代码,效果图等 思路 使用到的包 实现代码 效果图: 思路 ...
最新文章
- idea 快速导入实现父类方法_教你快速吸引精准粉丝实现流量变现的方法
- iPhone开发之 ARC是什么
- Web离线应用解决方案——ServiceWorker
- 约束优化方法之拉格朗日乘子法与KKT条件
- exists的用法 python_Python 办公自动化自动整理文件,一键完成!
- 华为留了一手!将继续发布P50、Mate50:搭载麒麟9000...
- 各浏览器中的鼠标滚轮事件处理
- 封装算法: 模板方法(Template Method)模式
- Javascript、jQuery 操作select控件大全(新增、修改、删除、选中、清空、判断存在等)(转)...
- Java集合框架源码解读(5)——TreeMap
- 简单使用hibernate(idea中使用)
- 学习OpenCV研究报告指出系列(二)源代码被编译并配有实例project
- 信息安全领域必考证书有哪几本?
- 代码编辑器 Sublime Text 系列——安装、插件和菜单中英文对照
- 吴恩达机器学习笔记-无监督学习
- 央企招聘:国家水利部直属单位2023公开招聘
- Vue子传父详细教程
- 考研中国科学院大学计算机分数线,中国科学院大学2017年考研分数线
- 中国艺术孙溟㠭书画《光》
- 谈学习中的改变——有病要诊断,有药要服用
热门文章
- 电动汽车 V2G 放电模型 算法 考虑电动汽车家庭慢充和充电站快充两种模式下,模拟出一定数量电动汽车的日负荷曲线
- love——sir thomas browne
- mysql执行sql语句按钮_mysql执行sql语句过程
- linux登录命令无法使用吗,Linux以www(无登录权限)身份执行命令 | kTWO-个人博客
- 余额宝收益太低怎么办?
- iOS16系统开启开发者模式
- 中国科学技术大学计算机怎么样,中国科学技术大学计算机科学与技术学院
- 自动化控制柜图纸设计,西门子200SMART
- SD-WAN如何重塑零售行业?
- Eclipse Theia 揭秘之技术架构篇