需求驱动

我写了很多文章,用docx来保存,现在想把他放到博客上,我该怎么做?复制粘贴?不!我要格式转换!

DOCX转换成HTML

from pydocx import PyDocX
html = PyDocX.to_html(r"E:\工作管理\环境搭建\文档上传\格式转换\test.docx")
f = open("test.html", 'w', encoding="utf-8")
f.write(html)
f.close()

如上图已经生成文件,我们看看效果:

如上图,效果还是不错的。

HTML转换成markdown

from pydocx import PyDocX
import html2text as hthtml = PyDocX.to_html(r"E:\工作管理\环境搭建\文档上传\格式转换\test.docx")
f = open("test.html", 'w', encoding="utf-8")
f.write(html)
f.close()text_maker = ht.HTML2Text()
text_maker.bypass_tables = False
path =r"E:\工作管理\环境搭建\文档上传\格式转换\test.html"
htmlfile = open(path,'r',encoding='UTF-8')
htmlpage = htmlfile.read()
text = text_maker.handle(htmlpage)
md = text.split('#')
open("test.md","w").write(md[1])

Python将DOCX转换为markdown文件相关推荐

  1. Word处理控件Aspose.Words功能演示:在 Java 中将 Word DOCX 转换为 Markdown

    如今,Markdown ( MD ) 格式被广泛用于编写在线文章.博客和文档.但是,在大型文档的情况下,它的语法变得难以记忆和书写.为方便起见,您可以在 MS Word 中编写内容,然后将DOCX文件 ...

  2. 将py文件转换成html,(2条消息)自制 Python小工具 将markdown文件转换成Html文件

    今天看到了一个Python库,名为markdown.瞬间就给了我一个灵感,那就是制作一个将markdown文件转换成html文件的小工具. 我的实验环境操作系统: Windows 7 64位 旗舰版 ...

  3. python将图片转换为PDF文件

    工作中需要将众多图片转换为PDF文件,在线的各种工具又感觉不是很安全,于是就想到用python写一个小工具, 完成批量图片转换PDF功能. 主要使用python的fitz插件,通过在命令行输入pip ...

  4. 使用python讲二进制转换为音频文件_Python使用ffmpy将amr格式的音频转化为mp3格式的例子...

    最近做了一个项目,将从微信下载的音频文件(默认为.amr格式)转化为mp3格式(否则前端播放将会遇到困难)上传到云端.经过一番研究,最终决定采用Python的ffmpy包. 安装只需执行 pip in ...

  5. Word doc/docx 格式文件转换为 MarkDown

    异想之旅:本人原创博客完全手敲,绝对非搬运,全网不可能有重复:本人无团队,仅为技术爱好者进行分享,所有内容不牵扯广告.本人所有文章仅在CSDN.掘金和个人博客(一定是异想之旅域名)发布,除此之外全部是 ...

  6. labeme批量转换json文件_Python实现markdown文件批量转换为word

    Python实现markdown文件批量转换为word 正所谓,不会markdown的技术员不是老司机,自从用上markdown之后,人生又到了一波小高峰.有好东西怎么能不共享之,因此随之我不断的普( ...

  7. python rtftotxt_利用python将docx文件转为txt

    背景:工作中需要将文件夹下的若干word文件docx转换为对应txt文本格式 因此需要将docx中文本读取出来,然后保存为txt格式即可 转换docx文件 需要的python模块为python-doc ...

  8. python docx与doc 文件互相转换

    因文件格式要求,需要将docx 与doc文件相互转换,特寻找python代码,与大家共分享 from win32com import client#转换doc为docx def doc2docx(fn ...

  9. python批量操作word文档实战_python批量实现Word文件转换为PDF文件

    本文为大家分享了python批量转换Word文件为PDF文件的具体方法,供大家参考,具体内容如下 1.目的 通过万能的Python把一个目录下的所有Word文件转换为PDF文件. 2.遍历目录 作者总 ...

最新文章

  1. 谷歌无人车之父刚推出的“无人驾驶入门”课,到底能学到啥?
  2. PHPWAMP集成环境Zend组件的相关介绍,环境默认的PHP运行模式
  3. fabric-ca-server 配置mysql数据库,区块链(4)
  4. Qt 视图框架示例 Colliding Mice 的翻译
  5. android StringBuilder的Capacity的使用
  6. 大学计算机基础书本里的毕业论文源稿,计算机基础毕业论文范文
  7. iOS开发工程师笔试题
  8. java生成和识别二维码
  9. C++11中0与 NULL与nullptr之间的关系
  10. Hyperledger Fabric 或 Composer 获取某个channel区块链的信息 或 区块链的最新高度
  11. AD18原理图绘制步骤
  12. 人脸对齐—3DDFA
  13. 计算机硬件选购与市场调查实验报告,计算机组装与维护实训报告范例-20210527010902.docx-原创力文档...
  14. 医学方面的创业计划书_医学生创业计划书怎么写
  15. 街头篮球常常服务器连接中断,街头篮球总是掉线,街头篮球打一局就掉线
  16. AngularJS笔记
  17. KITTI下使用SGBM立体匹配算法获得深度图
  18. 追踪ws的怪蜀黍(DFS)
  19. 搭建华为FusionCompute虚拟化平台(转载)
  20. 光标突然由竖线变成小黑块怎么解决?

热门文章

  1. video downloadhelper 解除时间限制_加工承揽合同可以随时解除吗?
  2. 行业调研与需求分析方法
  3. android 锁屏通知
  4. 服务号模板消息群发功能怎么实现?附解决方法
  5. MySQL去重3种方法​,还有谁不会?
  6. 精神病学复习重点归纳
  7. 0910期即将上市:优秀产品三部曲+如何做绩效考核?+……
  8. c语言中中括号的作用,括号的拼音,c语言中中括号什么意思?[ ]?
  9. Android 中 利用 AccessibilityService 辅助服务 模拟点击事件
  10. word 显示左侧导航条(目录条)