Java实现网页截图技术
事实上,如果您想以Java实现网页截图,也就是“输入一段网址,几秒钟过后就能截取一张网页缩略图”的效果。那么,您至少有3种方式可以选择。

1、最直接的方式——使用Robot

方法详解:该方法利用Robat提供的强大桌面操作能力,硬性调用浏览器打开指定网页,并将网页信息保存到本地。
优势:简单易用,不需要任何第三方插件。
缺点:不能同时处理大量数据,技术含量过低,属于应急型技巧。
实现方法:使用如下代码即可。

public static void main(String[] args) throws MalformedURLException,IOException,URISyntaxException,AWTException {//此方法仅用于JDK1.6及以上版本Desktop.getDesktop().browse(new URI("https://www.baidu.com/"));Robot robot = new Robot();robot.delay(1000);Dimension d = new Dimension(Toolkit.getDefaultToolkit().getScreenSize());int width = (int)d.getWidth();int height = (int)d.getHeight();//最大化浏览器robot.keyPress(KeyEvent.VK_F11);robot.delay(2000);Image image = robot.createScreenCapture(new Rectangle(0,0,width,height));BufferedImage bi = new BufferedImage(width,height,BufferedImage.TYPE_INT_RGB);Graphics q = bi.createGraphics();q.drawImage(image,0,0,width,height,null);ImageIO.write(bi,"jpg",new java.io.File("C:\\Users\\Administrator\\Desktop\\测试项\\baidu.jpg"));}

2、最常规的方式——利用JNI,调用第三方C/C++组件

方法详解:目前来讲,Java领域对于网页截图组件的开发明显不足(商机?),当您需要完成此种操作时,算得上碰到了Java的软肋。但是,众所周知Java也拥有强大的JNI能力,可以轻易将C/C++开发的同类组件引为己用。

优势:实现简单,只需要封装对应的DLL文件,就可以让Java实现同类功能。

劣势:同其他JNI实现一样,在跨平台时存在隐患,而且您的程序将不再属于纯Java应用。

实现方法:可参见此用例,具体封装何种C/C++组件请自行选择。

PS:示例来源于ACA HTML to Image Converter项目(http://www.acasystems.com/en/web-thumb-activex/faq-convert-html-to-image-in-java.htm ),这是一个收费的HTML转Image第三方组件,但封装方式在Java中大同小异。

引用JNI封装:

import sun.awt.*;
import java.awt.*;
import javax.swing.*;
import java.awt.event.*;
import java.awt.*;
import java.awt.peer.*;
public class Snap
{static{System.loadLibrary("Snap");}public static void main( String[] argv ){Snap t_xSnap = new Snap();t_xSnap.Start("http://www.google.com", "snapshot-google.png");}public native void Start(String pi_strURL, String pi_strImageName);
}

CPP部分的实现:

#include <windows.h>
#include <atlbase.h>
#include "snap.h"
#pragma comment(lib,"atl.lib")
#import "./../../acawebthumb.dll" no_namespace
JNIEXPORT void JNICALL Java_Snap_Start(JNIEnv *pEnv, jobject, jstring pi_strUrl, jstring pi_strFileName)
{CoInitialize(0);_bstr_t t_strUrl = pEnv->GetStringUTFChars(pi_strUrl, 0);_bstr_t t_strFileName = pEnv->GetStringUTFChars(pi_strFileName, 0);   IThumbMakerPtr HTML_Converter = NULL;HRESULT hr = HTML_Converter.CreateInstance(L"ACAWebThumb.ThumbMaker"); if (SUCCEEDED(hr)){ HTML_Converter->SetURL(t_strUrl);if ( 0 == HTML_Converter->StartSnap() )HTML_Converter->SaveImage(t_strFileName);}if (HTML_Converter)HTML_Converter.Release();CoUninitialize();
}

以该组件图像化yahoo界面的效果图:

3、最扎实的方法——自行解析HTML标记,并将其图像化

方法详解:众所周知,HTML之所以在浏览器中以具体的网页格式出现,并非服务器端传了一整个应用到客户端,而是源自于浏览器对于客户端自行解析的结果。因此,只要我们将对应的解析一一实现,那么将网页图形化,就将不是什么难事。

优势:纯Java实现,一劳永逸,一旦开发完成则永远通用,而且有一定的商用价值。

劣势:开发费时,且需要针对不同语法做精确分析,才能保证输出的基本正确。尤其在涉及到JavaScript解析时,难度将尤其增大。

实现方法:目前尚无具体案例可供参考。但是,由于Java有jdic之类的浏览器项目存在(https://jdic.dev.java.net/ ),而Java图形界面又属绘制生成。从理论上说,我们可以将所有具备Graphics的组件图形化保存。

而如果自行解析,那么您需要建立HTML解析器(或使用第三方的,万幸Java在这方面的组件很多),了解Java2D机制,了解何时该使用drawString绘制文字,何时又该使用drawImage插入图片等等。

补充:

这是一个利用内置浏览器截图的示例,使用了DJNativeSwing组件。

示例工程下载地址(Eclipse工程,含lib):http://greenvm.googlecode.com/files/Screenshot.7z

import java.awt.BorderLayout;
import java.awt.Dimension;
import java.awt.FlowLayout;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
import javax.swing.JFrame;
import javax.swing.JPanel;
import javax.swing.SwingUtilities;
import chrriis.dj.nativeswing.swtimpl.NativeComponent;
import chrriis.dj.nativeswing.swtimpl.NativeInterface;
import chrriis.dj.nativeswing.swtimpl.components.JWebBrowser;
import chrriis.dj.nativeswing.swtimpl.components.WebBrowserAdapter;
import chrriis.dj.nativeswing.swtimpl.components.WebBrowserEvent;
public class Main extends JPanel {/*** */private static final long serialVersionUID = 1L;// 行分隔符final static public String LS = System.getProperty("line.separator", "/n");// 文件分割符final static public String FS = System.getProperty("file.separator", "//");//以javascript脚本获得网页全屏后大小final static StringBuffer jsDimension;static {jsDimension = new StringBuffer();jsDimension.append("var width = 0;").append(LS);jsDimension.append("var height = 0;").append(LS);jsDimension.append("if(document.documentElement) {").append(LS);jsDimension.append("  width = Math.max(width, document.documentElement.scrollWidth);").append(LS);jsDimension.append("  height = Math.max(height, document.documentElement.scrollHeight);").append(LS);jsDimension.append("}").append(LS);jsDimension.append("if(self.innerWidth) {").append(LS);jsDimension.append("  width = Math.max(width, self.innerWidth);").append(LS);jsDimension.append("  height = Math.max(height, self.innerHeight);").append(LS);jsDimension.append("}").append(LS);jsDimension.append("if(document.body.scrollWidth) {").append(LS);jsDimension.append("  width = Math.max(width, document.body.scrollWidth);").append(LS);jsDimension.append("  height = Math.max(height, document.body.scrollHeight);").append(LS);jsDimension.append("}").append(LS);jsDimension.append("return width + ':' + height;");}//DJNativeSwing组件请于http://djproject.sourceforge.net/main/index.html下载public Main(final String url, final int maxWidth, final int maxHeight) {super(new BorderLayout());JPanel webBrowserPanel = new JPanel(new BorderLayout());final String fileName = System.currentTimeMillis() + ".jpg";final JWebBrowser webBrowser = new JWebBrowser(null);webBrowser.setBarsVisible(false);webBrowser.navigate(url);webBrowserPanel.add(webBrowser, BorderLayout.CENTER);add(webBrowserPanel, BorderLayout.CENTER);JPanel panel = new JPanel(new FlowLayout(FlowLayout.CENTER, 4, 4));webBrowser.addWebBrowserListener(new WebBrowserAdapter() {// 监听加载进度public void loadingProgressChanged(WebBrowserEvent e) {// 当加载完毕时if (e.getWebBrowser().getLoadingProgress() == 100) {String result = (String) webBrowser.executeJavascriptWithResult(jsDimension.toString());int index = result == null ? -1 : result.indexOf(":");NativeComponent nativeComponent = webBrowser.getNativeComponent();Dimension originalSize = nativeComponent.getSize();Dimension imageSize = new Dimension(Integer.parseInt(result.substring(0, index)), Integer.parseInt(result.substring(index + 1)));imageSize.width = Math.max(originalSize.width,imageSize.width + 50);imageSize.height = Math.max(originalSize.height,imageSize.height + 50);nativeComponent.setSize(imageSize);BufferedImage image = new BufferedImage(imageSize.width,imageSize.height, BufferedImage.TYPE_INT_RGB);nativeComponent.paintComponent(image);nativeComponent.setSize(originalSize);// 当网页超出目标大小时if (imageSize.width > maxWidth|| imageSize.height > maxHeight) {//截图部分图形image = image.getSubimage(0, 0, maxWidth, maxHeight);/*此部分为使用缩略图int width = image.getWidth(), height = image.getHeight();AffineTransform tx = new AffineTransform();tx.scale((double) maxWidth / width, (double) maxHeight/ height);AffineTransformOp op = new AffineTransformOp(tx,AffineTransformOp.TYPE_NEAREST_NEIGHBOR);//缩小image = op.filter(image, null);*/}try {// 输出图像ImageIO.write(image, "jpg", new File(fileName));} catch (IOException ex) {ex.printStackTrace();}// 退出操作System.exit(0);}}});add(panel, BorderLayout.SOUTH);}public static void main(String[] args) {NativeInterface.open();SwingUtilities.invokeLater(new Runnable() {public void run() {// SWT组件转Swing组件,不初始化父窗体将无法启动webBrowserJFrame frame = new JFrame("以DJ组件保存指定网页截图");// 加载指定页面,最大保存为640x480的截图frame.getContentPane().add(new Main("http://blog.csdn.net/cping1982", 640, 480),BorderLayout.CENTER);frame.setSize(800, 600);// 仅初始化,但不显示frame.invalidate();frame.pack();frame.setVisible(false);}});NativeInterface.runEventPump();}
}

Java实现网页截图技术相关推荐

  1. java web 截图_如何以Java实现网页截图技术

    今天看到某网友关于"如何以Java实现网页截图技术"的咨询帖,由于出现该咨询的地点非常不适合较长回复,故以博文形式回答. 事实上,如果您想以Java实现网页截图,也就是" ...

  2. 如何以Java实现网页截图技术

    今天看到某网友关于"如何以Java实现网页截图技术"的咨询帖,由于出现该咨询的地点非常不适合较长回复,故以博文形式回答. 事实上,如果您想以Java实现网页截图,也就是" ...

  3. java webengine_如何以Java实现网页截图技术

    展开全部 使用JavaFX8(JDK8打包在一起) public void start(Stage primaryStage) throws Exception { final WebView vie ...

  4. 如何以Java实现网页截图技术,根据URL得到网页快照

    // 此方法仅适用于JdK1.6及以上版本 Desktop.getDesktop().browse( new URL("http://www.csdn.net/").toURI() ...

  5. IE网页截图技术笔记

    网页截图技术似乎并不是很复杂,网上有很多实例,但是真的想搞清楚的话,还是有很多细节需要注意的.下面是我个人一些经验总结. 有3个技术方案,可以实现IE截图 这篇博客(http://blog.csdn. ...

  6. Java phantomjs 网页截图

    简介 根据传入的url对网页进行截图.打开网页和截取图片通过软件phantomjs.exe在后台静默完成.注:该过程不需要打开浏览器 优点: 1.该软件支持多个平台,包括Linux,Windows. ...

  7. [IE编程] IE网页截图技术总结

    IE网页截图是IE编程中的经典问题. IE9 beta发布之后我收到很多关于这方面的问题. 最近我把IE和Windows中这部分相关的代码重新架构了一下,使它们能够在IE9开启硬件加速的情况下完美兼容 ...

  8. java selenium 网页截图 可控制分辨率

    项目地址如下 https://gitee.com/ogisosetsuna_kong/screenshot screenshot 用SpringBoot以及selenium实现了一个无chromeGu ...

  9. 使用PhantomJS实现网页截图服务

    使用PhantomJS实现网页截图服务 2015-12-12来源:Java教程人气:99 这是上半年遇到的一个小需求,想实现网页的抓取,并保存为图片.研究了不少工具,效果都不理想,不是显示太差了(Ca ...

  10. 网页截图和svg模版动态生成图片Java实现

    网页截图和svg模版动态生成图片Java实现 使用场景 需要Java语言动态生成图片 用流程图简单说明下我这边工作中使用的场景 仅供参考 所以这里就需要生成证书了 我先给大家看下最终实现的图片效果 这 ...

最新文章

  1. oracle sid环境变量,ORACLE_SID环境变量设置的问题
  2. python变量详解_Python 变量详解[学习 Python 必备基础知识][看此一篇就够了]
  3. Elasticsearch 7.0 已经发布,盘他!
  4. 【Python】我的Pandas学习经历及动手实践
  5. 《C++ Primer Plus(第六版)》(25)(第十三章 类继承 笔记)
  6. 精华阅读第6期|程序猿的世界,你不懂!
  7. 读书笔记:《亮剑 .Net》——将类转化为XML并保存已经去读后反序列化为类对象...
  8. merge合并两个有序数组
  9. 2018_09_25_参加医学人工智能大会的个人思考
  10. ffmpeg 视频码率压缩、质量控制 -crf 和 -qp 参数详解
  11. GHOST启动盘制作
  12. 【聊技术】在Android中实现自适应文本大小显示
  13. AppInventor之数据库、MQTT及导出Excel表格
  14. 一次设置,终生屏蔽cdsn
  15. 大型综合股票金融财经门户网站模板源码
  16. 数学符号的意义总结(未完待续)
  17. Maven与Gradle项目构建工具
  18. 《权威指南》笔记 -- 8.3 函数的实参和形参
  19. JVM篇·垃圾收集器与内存分配策略
  20. ubuntu android开发环境配置、jdk、Git、虚拟机、微信、xmind、搜狗等常用软件安装

热门文章

  1. 万字长文:上海交大校友、宾大直博博士细说五年读博经历
  2. 漫威系列电影、电视剧的推荐观看顺序是怎样的?
  3. 战地1服务器怎么显示fps,《战地1》显示FPS帧数方法介绍 怎么显示FPS帧数
  4. arduino步进电机程序库_Arduino步进电机控制示例
  5. 唐福林《新浪微博开放平台中的Redis实践》演讲视频
  6. 写乐100道练习题_【写乐钢笔使用】_摘要频道_什么值得买
  7. 服务器内存型号的后缀字母,收藏!CPU型号20种后缀字母是什么意思?不再被坑!...
  8. 考研日语线上笔记(六):完型专项篇
  9. 华为eSight网络监控平台配置短信功能说明
  10. 《阿里云服务器教程1》:如何购买阿里云服务器