此方法适用最新的道客巴巴网站,使用html5的canvas元素进行文档内容显示的情况。其实canvas元素显示的就是图片,所有的文档pdf,ppt,doc等都是通过这些网站的后台转为图片后显示在网站上的,所以此方法只是拿到网站显示的图片,不能拿到原始格式的文件。

道客巴巴

豆丁文档目前是使用swf+canvas的方式,在页面没法直观看到canvas元素,所以此方法不能保存豆丁文档。

在谷歌浏览器中,F12打开开发者工具,切换到console控制台输出页签,运行如下js代码,输出canvas文件转为图片base64编码格式的长文本,如下图

document.getElementById('page_1').toDataURL()

点击copy,然后粘贴到文本编辑器软件中,此处使用Notepad++。

把这一长串canvas图片的base64编码文本,最开始的标识字符去掉,即去掉尖括号内部分 <data:image/png;base64, >剩余字符贴到提供图片base64解码的网站中还原为图片,例如网站 http://www.atool.org/img2base64.php

点击 “还原生成的Base64编码为图片”

在解码后生成的图片上邮件,另存为图片即可。

此种方式,针对多页的文档,只能一页页的手工处理,除了使用图片base64解码的网站解码外,还可以编写代码解码,但是同样的要注意把文本格式的图片base64编码的最开始部分要去掉,java解码代码如下

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import sun.misc.BASE64Decoder;
import sun.misc.BASE64Encoder;

public class Data2ImgTest {

public static void main(String[] args) {
Data2ImgTest.GenerateImage(Data2ImgTest.readFileByLines("imagedata.txt"));
}

//图片转化成base64字符串
public static String GetImageStr(String path) {//将图片文件转化为字节数组字符串,并对其进行Base64编码处理
String imgFile = path;//待处理的图片
InputStream in = null;
byte[] data = null;
//读取图片字节数组
try {
in = new FileInputStream(imgFile);
data = new byte[in.available()];
in.read(data);
in.close();
} catch (IOException e) {
e.printStackTrace();
}
//对字节数组Base64编码
BASE64Encoder encoder = new BASE64Encoder();
return encoder.encode(data);//返回Base64编码过的字节数组字符串
}

//base64字符串转化成图片
public static boolean GenerateImage(String imgStr) {
System.out.print("已经收到了把字节码转化为图片的方法");
//对字节数组字符串进行Base64解码并生成图片
if (imgStr == null) //图像数据为空
return false;
BASE64Decoder decoder = new BASE64Decoder();
try {
//Base64解码
byte[] b = decoder.decodeBuffer(imgStr);
for (int i = 0; i < b.length; ++i) {
if (b[i] < 0) {//调整异常数据
b[i] += 256;
}
}
//生成jpeg图片
//System.currentTimeMillis()
String imgFilePath = "C:\\Java\\school_mart.jpg";//新生成的图片
OutputStream out = new FileOutputStream(imgFilePath);
out.write(b);
out.flush();
out.close();
return true;
} catch (Exception e) {
return false;
}

}

/** 
* 以行为单位读取文件,常用于读面向行的格式化文件 
*/

public static String readFileByLines(String fileName) {
String resultString = "";
File file = new File(fileName);
BufferedReader reader = null;
try {
reader = new BufferedReader(new FileReader(file));
String tempString = null;
int line = 1;
// 一次读入一行,直到读入null为文件结束  
while ((tempString = reader.readLine()) != null) {
// 显示行号  
//System.out.println("line " + line + ": " + tempString);
resultString += tempString;
line++;
}
reader.close();
} catch (IOException e) {
e.printStackTrace();
} finally {
if (reader != null) {
try {
reader.close();
} catch (IOException e1) {
}
}
}
return resultString;
}

}

如果有哪位大神可以把这个过程写成自动化处理程序,那么就完美了。可惜下载的始终是文档的页面转换后的图片,在进行多次放大后会失真,并且最终生成的文件大小也会比原始文档大很多。

参考博客:

1.https://blog.csdn.net/hb707934728/article/details/68945763

2.https://blog.csdn.net/shb2058/article/details/77523330

道客巴巴 文档免积分保存方法相关推荐

  1. python 下载道客巴巴文档

    python 下载道客巴巴文档 环境准备 首先,我们会使用到selenium这个库,直接用pip安装即可,有关于selenium的使用还需要安装浏览器驱动和配置环境变量,在这里就不过多阐述,很多博客中 ...

  2. 如何免费下载道客巴巴文档

    1.下载安装 稻壳阅读器 http://www.daokeyuedu.com/ 2.找到需要下载的文档,选择用 稻壳阅读器 打开对应文档. 3.点击左上角的"打印",弹出打印对话框 ...

  3. 道客巴巴 文档下载方法

    稻壳阅读器打印下载 稻壳阅读器是一个面向文库的阅读软件,在电脑上安装之后,直接打开,将文库链接复制进去就能快速阅读. 想要保存文档的话,如果是免费文档,直接点击下载按钮,然后就可以直接将文档下载到本地 ...

  4. 道客巴巴文档下载方案

    1         使用webbrowser控件,打开指定文件. 2         屏幕截取每一页的内容,生成图象. 3         使用iTextSharp,将生成的图象转换为PDF文件. 最 ...

  5. python 爬取道客巴巴文档_Python常用的几个高效率的爬虫框架

    1.Scrapy Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中.用这个框架可以轻松爬下来如亚马逊商品信息之类的数 ...

  6. 学习笔记100—强制免费下载 百度文库等网站上文档 以及客道巴巴文档 教程

    一.百度文库,豆丁.丁香.畅享.MBALib.Book118等文库文档下载 用冰点软件,将自己想要下载的链接复制到冰点软件中,即可下载,软件下载链接:http://www.bingdian001.co ...

  7. 冰点下载-支持百度文库、道客巴巴、豆丁等主流文库平台文档下载

    一个文档下载神器,有了它,就不用再开VIP了,亲测有效.软件界面如下:支持百度文库.道客巴巴.豆丁等主流文库平台文档下载,功能十分强大. 资源获取:冰点下载

  8. 2023 最新一键下载百度网盘/阿里云盘/百度文库/道客巴巴/原创力文档

    苏生不惑第415 篇原创文章,将本公众号设为星标,第一时间看最新文章. 之前分享过录制了个视频:2022年11月一键下载百度网盘/百度文库/豆丁/道客巴巴/原创力文档 ,2023年再更新下 . 爱奇艺 ...

  9. DayDayUp:教你一招如何在道客巴巴免费下载自己被侵权的文章

    DayDayUp:教你一招如何在道客巴巴免费下载自己被侵权的文章 目录 教你一招如何在道客巴巴免费下载自己被侵权的文章 定位到侵权文章链接 第一步,点击[打印] 第二步,利用稻壳阅读器软件打开文章 T ...

  10. Typora markdown公式换行等号对齐_Typora-编写博客格式化文档的最佳软件

    Typora-编写博客格式化文档的最佳软件 Typora 不仅是一款支持实时预览的 Markdown 文本编辑器,而且还支持数学公式.代码块.思维导图等功能.它有 OS X.Windows.Linux ...

最新文章

  1. HTTP协议详解(真的很经典)
  2. 「查缺补漏」巩固你的 RocketMQ 知识体系
  3. php mysql读写分离主从复制_mysql主从复制 读写分离原理及实现
  4. Log4Net使用入门
  5. 刷新SqlServer所有视图【存储过程】
  6. select与pselect的信号屏蔽
  7. android sonar 简书,SonarQube对ios、android代码检测
  8. table数据表 边框特效
  9. python偏函数和高阶函数_Python高阶函数-偏函数
  10. cmake命令的python库的位置参数-DTORCH_PATH
  11. Python re模块将字符串分割为列表
  12. python dict下标_牛鹭学院:必须掌握的Python数据结构知识
  13. java分页数据再次进行分页操作
  14. Gson解析json字符串
  15. 凯恩帝对刀和刀补_KND数控车床试切对刀和调刀补
  16. Python全栈笔记(六)
  17. 南澳大学计算机科学专业学费,2020年南澳大学学费(本科及研究生)及学费支付方式解析!...
  18. 强大如斯的Bunch类
  19. 面朝大海,春暖花开,有wifi
  20. ffmpeg开源工具的使用_使用开源工具玩龙与地下城

热门文章

  1. web界面设计要素及基本设计规范
  2. 一文读懂元宇宙,AI、灵境计算...核心技术到人文生态
  3. android 被自动安装cibn合一,Android v4.2.2 ROOT方法,可能也适用于很多同版系统的安卓电视!...
  4. 开启samba服务的设置步骤
  5. 3串口多串口双串口以及2串口UART转WiFi多跳通讯实现二
  6. C-LODOP打印插件使用
  7. 《应用时间序列分析:R软件陪同》——1.3 R软件入门
  8. R语言-基于集波士顿住房
  9. 如何正确做笔记?符号笔记法、康奈尔笔记法总结!
  10. excel生成二维码