html转word 文档 doc docx
在做项目时,要将富文本编辑器,或是html内容 导出为word。
先引入文件保存js
<script src="FileSaver.js"></script>
方法一
使用 html-docx.js、FileSaver.js 文件
导出为Docx
docx体积更小,而且word2007也可以打开
1.引用插件html-docx.js
<script src="html-docx.js"></script>
2.构建完整的html内容文档
var content = '<!DOCTYPE html><html><head><meta charset="UTF-8"></head>'+ 要导出的html信息 +'</html>
content要导出的html信息,建议在服务端自己拼接完成。
若是想从页面抓取html信息,可以用下面的方法(不建议,客户端消耗高)
html:
<div id="content">要导出的html信息<img src="xxx">
</div>
function convertImagesToBase64 (content) {var regularImages = content.querySelectorAll("img");var canvas = document.createElement('canvas');var ctx = canvas.getContext('2d');[].forEach.call(regularImages, function (imgElement) {// preparing canvas for drawingctx.clearRect(0, 0, canvas.width, canvas.height);canvas.width = imgElement.width;canvas.height = imgElement.height;ctx.drawImage(imgElement, 0, 0);// by default toDataURL() produces png image, but you can also export to jpeg// checkout function's documentation for more detailsvar dataURL = canvas.toDataURL();imgElement.setAttribute('src', dataURL);})canvas.remove();}
var content = document.getElementById('#content');
convertImagesToBase64(content);//转换图片为base64content = '<!DOCTYPE html><html><head><meta charset="UTF-8"></head>'+ content +'</html>'
3.利用脚本导出word
var converted = htmlDocx.asBlob(content);saveAs(converted, 'test.docx');// 用 FielSaver.js里的保存方法 进行输出
方法二
导出为Doc
使用 html-docx.js、FileSaver.js 、wordexport文件
1.引入jquery和wordexport
<script src="https://cdn.bootcss.com/jquery/3.4.1/jquery.min.js"></script>
<script src="wordexport.js"></script>
2.使用导出
$(元素).wordExport(文件名,isBase64)
isBase64 用于标识 元素中的图片是否都处理为了base64,默认为false,内置处理方法,可以去看看
注意
无论是html-docx.js还是 wordexport.js 都需要将html中的图片转为base64形式
而且,图片的宽度高,最好自己设置下,否则下载的图片会以图片原始大小下载,就会出现以下,图片在文档超出情况
处理图片的宽高,可以采用 正则替换,这里给出两种替换参考(平时不太写正则,所以有点挫)
C#:
string reg = "<img.*? src=[\"'](.*?)['\"].*?>";
MatchCollection collections = Regex.Matches(description, reg);
if (collections.Count > 0)
{foreach (Match match in collections){Regex regWidth = new Regex("width\\s*=\\s*\\S+ ");if (!regWidth.IsMatch(img))//img 中不存在width {//获取其他属性进行替换Regex reg1 = new Regex(@"style\s*=(['""\s]?)[^'""]*?\1"); ;img = reg1.Replace(img, "width=\"350\" height=\"216\" ");//按黄金比例替换}else{Match mathWidth = regWidth.Match(img);if (mathWidth.Success){string widh = mathWidth.Value.Substring(7).Substring(0, mathWidth.Value.Substring(7).Length - 2);//widthif (int.Parse(widh) > 400) {//原宽超出400Regex regHeight = new Regex(@"height\s*=(['""\s]?)[^'""]*?\1");Match mathHeight = regHeight.Match(img);if (mathHeight.Success){string height = mathHeight.Value.Substring(8).Substring(0, mathHeight.Value.Substring(8).Length - 1);img = regHeight.Replace(img, "height=\" " + 350 * int.Parse(height) / int.Parse(widh) + "\"");//按比例替换 高}img = regWidth.Replace(img, "width=\"350\"");}}}}
}
若是二进制流存储的图片数据,可以通过Bitmp来读取原始大小 ,然后按照原始比例再进行缩放
//通过二进制流 获取图片原始宽高
private int[] GetScaleImgSizeByByte(byte[] image)
{MemoryStream stream = new MemoryStream(image);//内存流写入Bitmap bmp = new Bitmap(stream);int width = 600;//先指定一个固定大小 和word页面边距最大宽差不多int height = 600;if (bmp.Width > 600){height = (int)(width * ((double)bmp.Height / (double)bmp.Width));}if (height > 600 || bmp.Height > 600){//调完宽后判断高 height = 600;width = (int)(height / ((double)bmp.Height / (double)bmp.Width));}return new int[] { width, height };
}
js正则替换:
var str = htmlText.replace(/(<img[^>]*)(\/?>)/gi, function (match, capture) {if(match.match(/width\s*?=\s*?([‘"])[\s\S]*?\1/ig)==null)match = match.replace(/(<img[^>]*)(\/?>)/gi,"$1 width='350' $2")//没有宽就增加宽return match.replace(/style\s*?=\s*?([‘"])[\s\S]*?\1/ig, '').replace(/width\s*?=\s*?([‘"])[\s\S]*?\1/ig ,"width='350'");
});
方式三 使用poi
经过调研使用各种方式之后发现这种方法应该是对样式复杂的报告是最切合的
提供poi封装脚手架函数 Poi-tl Documentation
html转word 文档 doc docx相关推荐
- Word处理控件Aspose.Words功能演示:使用 C++ 创建 MS Word 文档 (DOC/DOCX)
Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...
- SpringBoot 导出Word文档(doc\docx) Office无法打开,WPS正常等坑
以下对于生成doc文档来说哒, 对于生成docx请移步https://blog.csdn.net/wantLight/article/details/106105416 首先引入freemarker依 ...
- js 导出word 文档 doc docx
在做项目时,要将富文本编辑器,或是html内容 导出为word. 先引入文件保存js <script src="FileSaver.js"></script> ...
- 如何批量将 Doc 格式的 Word 文档转为 Docx 格式
概要:我们都知道 Word 格式有多种.比如常见的有 Doc.Docx,这两种类型是能够相互兼容的,也是能够相互转化的.那今天给大家介绍的是如何将多个 Doc 格式文档批量转为 Docx 格式. 我们 ...
- 导出word文档生成docx格式 添加水印
为了导出docx格式看了等多文档,最后做个总结依赖包用到dom4j和freemarker,最为方便. <!-- https://mvnrepository.com/artifact/freema ...
- Java操作word文档将docx转换为pdf格式
Java操作word文档将docx转换为pdf格式 一.整体说明 在上传 Office 课件时,格式有:doc,docx,xls,xlsx,ppt,pptx,程序需要将其 转换成 pdf 格式, 才能 ...
- 如何下载腾讯在线文档?如何将腾讯在线文档导出为本地Word文档(.docx)
使用电脑访问腾讯文档链接,如:https://docs.qq.com/doc/DRWpuSVNTeG1ZcnhG 然后依次点击:[文件]->[导出为]->[本地Word文档(.docx)]
- C# DocX操作Word文档(.docx)
using System; using System.Collections.Generic; using System.Linq; using System.Reflection; using Sy ...
- 怎么把word文档的docx后缀去掉
怎么把word文档的docx后缀去掉 因为工作需要,所以我的电脑中有许多word文档,但是最近文件夹中每个word文档的文件名后面都有个docx后缀,请问怎么可以把这些后缀去掉? 谢谢. 沐飞尘 | ...
- word文档doc格式转换成docx
把doc格式转换成docx jar包下载 //把doc格式转换成docx//导入 Spire.Doc.jarDocument d = new Document("F:\\**\\**\\云想 ...
最新文章
- php增删改查前后端分离,前后端分离之前端增删改查
- asyncio 并发测试
- TCP socket编程记录(C语言)
- Jenkins和Jmeter的集成
- 100个网络基础知识,赶紧收藏吧!
- jQuery -- 光阴似箭(五):AJAX 方法
- 一家踏实做产品,在疫情下销售增速仍达35%的公司,年报长啥样?
- micro_macro
- SpringMVC 使用注解时控制器传参
- 如何获取Java用户输入?
- .gitignore中添加了忽略规则为何还是会提示版本更新,git如何清除部分文件的版本管理
- Linux Mint---开启桌面三维特效
- 2021年口腔正畸行业隐形矫治器专题研究报告
- 《最重要的事,只有一件》读书笔记
- hadoop大数据平台搭建
- 切图具体需要切什么内容_UI日常-切图切图怎么破?
- 农业银行网上银行服务器未响应,农业银行k宝没反应原因分析及解决方法
- java 折扣_Java折扣计算
- ndnSIM学习(四)——examples之ndn-simple.cpp超详细剖析
- Java容器深度总结:Java容器整体结构
热门文章
- 说说你对servlet 的理解或者 servlet 是什么?
- winform DevComponents.DotNetBar2 添加到工具栏方法
- 计算机休眠唤醒后 网络受限,彻底解决win10系统待机、休眠被唤醒后笔记本WIFI无线网无法连接的问题-网络教程与技术
-亦是美网络...
- linux 安装触摸版驱动程序,在ubuntu和linux上配置触摸屏驱动程序启用触摸屏
- 交换机和路由器技术-24-OSPF单区域配置
- C# WPF 一个设计界面
- VM options
- VMware12安装centOS8(vm虚拟机安装centos8教程)
- Ribbon 和 wowza 的集成开发
- MIT 线性代数 Linear Algebra 25: 对称矩阵的特征值特征向量,正定矩阵