原文
Word文档的内容,需要背转换为Asciidoc。以下是我发现最有效的步骤:

1. 将Word文档保存为HTML
2. 编码为UTF-8
3. 使用pandoc将HTML转换为AsciiDoc
4. 使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西
5. 使用Sublime Text 2执行任何剩余的格式

将Word文档保存为HTML

在Word中打开文档,然后另存为网页。保存时选择“仅保存显示信息到HTML”选项。从Word退出。

编码为UTF-8

在Sublime Text 2中打开html文件。重新打开UTF-8编码并保存文件:

Sublime Text 2重新打开编码
如果不重新编码为UTF-8,则下一步将失败并显示错误:

pandoc:无法解码字节’\ x6f’:Data.Text.Encoding.decodeUtf8:无效的UTF-8流

使用Pandoc将HTML转换为AsciiDoc

运行Pandoc。例如,以下命令将AsciiDoc文件file.asc转换为ConventionSheet.htm:

pandoc -f html -t asciidoc -o file.asc ConventionSheet.htm

使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西

奇怪的单引号需要去:

Sublime Text 2用单引号替换反引号,如果在Word中进行了审核,则审阅者的评论和更改可能会出现在HTML中。使用搜索删除这些,并在搜索字段中替换以下正则表达式:

\[line-through\]\*(.+)\*

当匹配行交叉线断裂时,可以使用?s正则表达式中的单行选项()进行搜索和替换:

(?s)\[line-through\]\*.(.*?)\*

使用Sublime Text 2执行任何剩余的AsciiDoc格式

在文档中等间隔任何正则表达式或其他特殊字符(这些将导致AsciiDoc解析器的问题)。

根据需要编辑AsciiDoc文档!请注意,GitHub现在本地显示AsciiDoc文件(在幕后使用AsciiDoctor),就像Markdown一样。

Word文档到Asciidoc转换相关推荐

  1. asciidoc转换html,Word文档到Asciidoc转换

    原文 Word文档的内容,需要背转换为Asciidoc.以下是我发现最有效的步骤: 1. 将Word文档保存为HTML 2. 编码为UTF-8 3. 使用pandoc将HTML转换为AsciiDoc ...

  2. wps的ppt怎么存html,如何将网页快速转换为WPS与WORD文档 ppt怎么转换成word文档

    导读:小编根据大家的需要整理了一份关于<如何将网页快速转换为WPS与WORD文档 ppt怎么转换成word文档>的内容,具体内容: 看到图文并茂的网页,想把它全部或部分转换为WPS或者WO ...

  3. Java——EasyPoi导出word文档,itextpdf转换pdf

    EasyPoi导出word文档,itextpdf转换pdf 文章目录 EasyPoi导出word文档,itextpdf转换pdf 前言 一.依赖 二.工具类 1.WordUtil 2.PDF工具类 3 ...

  4. html 转word c#,c#操作word类,进行html和word文档的互相转换

    #region 把Word文档装化为Html文件 /** ///把Word文档装化为Html文件/// /// 要转换的Word文档 public static void WordToHtml( st ...

  5. word文档doc格式转换成docx

    把doc格式转换成docx jar包下载 //把doc格式转换成docx//导入 Spire.Doc.jarDocument d = new Document("F:\\**\\**\\云想 ...

  6. html格式图片可以转换成word文档,html网页转换成word文档,转换成功,并且可以保存图片,但是总是为web版式的格式,怎么改成“页面”格式,多谢...

    当前位置:我的异常网» C# » html网页转换成word文档,转换成功,并且可以保存图 html网页转换成word文档,转换成功,并且可以保存图片,但是总是为"web版式"的格 ...

  7. 怎么把php转变成word文档,表格怎么转换成word文档

    转换方法:1.打开excel表格,点击"文件"-"另存为":2.保存类型设置为"单个网页类型",点击"选择工作表",点击 ...

  8. python html转word文档_Python实现将HTML转换成doc格式文件的方法示例

    本文实例讲述了Python实现将HTML转换成doc格式文件的方法.分享给大家供大家参考,具体如下: 网页上的一些文章,因为有格式的原因,它们在网页上的源码都是带有html标签的,用css来进行描述. ...

  9. 使用java将word文档docx,doc(包含图形,文本框)完美转换成所有格式图片(pdf,png,gif,jpeg等等)

    使用java将word文档docx,doc(包含图形,文本框,图片等)完美转换成所有格式图片(pdf,png,gif,jpeg等等)下文中附带代码,效果图等 思路 使用到的包 实现代码 效果图: 思路 ...

最新文章

  1. idea 快速导入实现父类方法_教你快速吸引精准粉丝实现流量变现的方法
  2. iPhone开发之 ARC是什么
  3. Web离线应用解决方案——ServiceWorker
  4. 约束优化方法之拉格朗日乘子法与KKT条件
  5. exists的用法 python_Python 办公自动化自动整理文件,一键完成!
  6. 华为留了一手!将继续发布P50、Mate50:搭载麒麟9000...
  7. 各浏览器中的鼠标滚轮事件处理
  8. 封装算法: 模板方法(Template Method)模式
  9. Javascript、jQuery 操作select控件大全(新增、修改、删除、选中、清空、判断存在等)(转)...
  10. Java集合框架源码解读(5)——TreeMap
  11. 简单使用hibernate(idea中使用)
  12. 学习OpenCV研究报告指出系列(二)源代码被编译并配有实例project
  13. 信息安全领域必考证书有哪几本?
  14. 代码编辑器 Sublime Text 系列——安装、插件和菜单中英文对照
  15. 吴恩达机器学习笔记-无监督学习
  16. 央企招聘:国家水利部直属单位2023公开招聘
  17. Vue子传父详细教程
  18. 考研中国科学院大学计算机分数线,中国科学院大学2017年考研分数线
  19. 中国艺术孙溟㠭书画《光》
  20. 谈学习中的改变——有病要诊断,有药要服用

热门文章

  1. 电动汽车 V2G 放电模型 算法 考虑电动汽车家庭慢充和充电站快充两种模式下,模拟出一定数量电动汽车的日负荷曲线
  2. love——sir thomas browne
  3. mysql执行sql语句按钮_mysql执行sql语句过程
  4. linux登录命令无法使用吗,Linux以www(无登录权限)身份执行命令 | kTWO-个人博客
  5. 余额宝收益太低怎么办?
  6. iOS16系统开启开发者模式
  7. 中国科学技术大学计算机怎么样,中国科学技术大学计算机科学与技术学院
  8. 自动化控制柜图纸设计,西门子200SMART
  9. SD-WAN如何重塑零售行业?
  10. Eclipse Theia 揭秘之技术架构篇