说到word文档转html的,网上一搜一大把,各种在线word转html页面,使用起来也方便。但是在实际项目中要使用的话,需要自己开发,这里就提供一个简单的方法。

后缀 .doc 和 .docx 都是word文档,doc是word2003以及之前版本保存的文档,docx是word2007、word2010等保存的新型文档,本质都是属于文字排版的文件。注意 这里提供的方法暂时是针对docx的。

这里使用pydocx的库,安装pip3 install pydocx,可以直接对docx文件进行处理,简单粗暴,PyDocX.to_html("**.docx"),返回值就是转换后的html的源码,然后再通过写文件,写到html文件里面。

from pydocx import PyDocX

html = PyDocX.to_html("test.docx")

f = open("test.html", 'w', encoding="utf-8")

f.write(html)

f.close()

这里对文件的处理都是当前文件夹下面的,得到的html文件可以直接打开查看,通过对html查看,可以发现文字转换成了P标签,图片使用base64 的方式显示的。

这里是对本地的文件进行处理,进一步部署到服务器上,我使用的是Django的项目,前端页面通过form 表单进行上传docx 文件。

type属性定为file,accept="application/vnd.openxmlformats-officedocument.wordprocessingml.document" 筛选docx 的文件。

这里上传的文件是docx格式的word文档,针对doc 的文档,可以手动改成docx后缀名,进行上传使用。 尝试用代码转换成docx,window平台下有相应的库,ubantu 暂时无果,欢迎码友提供解决方法。

介绍下window平台下的代码转换方法,pip3 install pypiwin32安装这个库,里面有win32com,将doc文档转成docx 的。

from win32com import client

word = client.Dispatch("Word.Application")

doc = word.Documents.Open("D:\\***\\**.doc") //绝对路径 doc文件

doc.SaveAs("D:\\***\\**.docx",16) //保存的docx 文件,绝对路径

doc.Close()

word.Quit()

python高级教程html文件_Python之html转docx文件高级用法相关推荐

  1. ThinkPHP5.0上传文件(MP3、MP4、Docx文件、图片..........)

    ThinkPHP5.0上传文件(图片) 樂楽认为:其实,上传MP3或上传MP4和上传图片的性质是一样的····· (先悄悄的告诉你们,图片的上传的办法) //上传 public function up ...

  2. python基础教程博客_Python基础教程_Python入门知识

    Python基础教程频道为编程初学者提供入门前的所有基础知识,必须要掌握的一些PYTHON基础语法语句,基本的数据类型. 让大家可以更快速.更容易理解的的方式掌握Python编程所需要的基础知识,灵活 ...

  3. python入门教程pdf免费_python入门教程pdf

    python入门教程pdf内容摘要 python入门教程pdf页符造成的空白页,龙岩英语教程,2.插上打印机电源线,2.插上电源插头,达德教程,2.茶包配合按.2.查看包着SIM的那张"大卡 ...

  4. python基础教程博客_python基础教程(一)

    之所以选择py交易有以下几点:1.python是胶水语言(跨平台),2.python无所不能(除了底层),3.python编写方便(notepad++等文本编辑器就能搞事情),4.渗透方面很多脚本都是 ...

  5. python核心教程百度云_Python核心技术与实战 共44讲 中文pdf高清版

    人工智能时代下,Python毫无疑问是最热的编程语言.有人夸它功能强大还上手轻松,有人说它学习曲线不那么陡峭,但是更多的人,在推开Python的大门后却发现,Python入门容易但精通却不易,Pyth ...

  6. python不同数据的读入_python读写不同编码txt文件_python读写txt文件

    python读写不同编码txt文件_python读写txt文件 以后整理规范 [python] view plaincopy import os import codecs filenames=os. ...

  7. 用python的pandas打开csv文件_python读写数据读写csv文件(pandas用法)

    python中数据处理是比较方便的,经常用的就是读写文件,提取数据等,本博客主要介绍其中的一些用法.Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用 ...

  8. python编程教程第九讲_Python入门学习视频,最全面讲解视频无偿分享,这些基础知识你都懂了吗?...

    2020最新Python零基础到精通资料教材,干货分享,新基础Python教材,看这里,这里有你想要的所有资源哦,最强笔记,教你怎么入门提升!让你对自己更加有信心,重点是资料都是免费的,免费!!! 如 ...

  9. python读取所有txt文件_python如何批量读取txt文件

    python批量读取txt文件的方法:首先导入系统模块:然后将文件夹路径更改为需要批量读取的txt文件存放的路径:再调用系统模块得到该文件夹下的所有文件名称:最后遍历文件夹,读取txt文件. 如果文件 ...

最新文章

  1. 在symfony2项目中100%提升doctrine的性能
  2. JavaScript强化教程——JavaScript 运算符
  3. 你应该掌握的七种回归技术
  4. 【深度学习】协同优化器和结构化知识蒸馏
  5. 统计一个字符串中的单词数
  6. MySQL(七)关于MySQL不同版本下临键锁锁定范围不同
  7. python怎么重命名word文件,Python读取word文本操作详解
  8. SharePoint文档上传管理
  9. cascade rcnn论文总结
  10. Netty核心组件总览
  11. WF4.0实战(九):猜数字游戏,测下你的智力
  12. mysql和oracle的时间字段区别_Oracle数据库中关于日期和时间字段类型
  13. 畅销书排行榜html作业,制作畅销书排行榜.html
  14. nvidia jetson xavier打开风扇,并设置开机启动
  15. USB驱动——键盘驱动(控制传输)
  16. sql常用语句(mysql)
  17. oracle创建用户,授权connect,resource后无法建表
  18. 强大的装逼,表白,炫富,恶搞短视频制作神器微信小程序源码支持多种流量主
  19. P124黎曼可积性刻画 的两个备注
  20. excel表格拆分怎么做?

热门文章

  1. 聊城大学计算机学院答辩,数学与信息工程系成功举办精品课程答辩会
  2. mysql数据库replace写入_MySQL数据库replace into 用法(insert into 的增强版)
  3. 机器学习(三十一)——Linear Discriminant Analysis
  4. 【机器学习】最大熵模型(Maximum Entropy Model)
  5. 浏览器访问web服务器的图解和tomcat体系结构图
  6. find命令的exec参数使用---Linux学习笔记
  7. RecycleView的正确打开方式
  8. 钱伯斯的遗产:思科与集成虚拟网络堆栈
  9. 多晶硅价格已处于阶段性高点
  10. java判断字符串中是否包含字母