Java: cdp4j - Java library for CDP,使用这个类库实现。

maven引入:

io.webfolder

cdp4j

1.1.0

官方例子:

import io.webfolder.cdp.Launcher;import io.webfolder.cdp.session.Session;import io.webfolder.cdp.session.SessionFactory;public class HelloWorld {    public static void main(String[] args) {        Launcher launcher = new Launcher();        try (SessionFactory factory = launcher.launch();                            Session session = factory.create()) {

session.navigate("https://webfolder.io");

session.waitDocumentReady();            String content = (String) session.getProperty("//body", "outerText");            System.out.println(content);

}

}

}

更多例子,如PrintToPDF,请参考https://github.com/webfolderio/cdp4j

原文:http://933177.blog.51cto.com/923177/1944018

java headless_使用Chrome Headless 快速实现java版数据的抓取相关推荐

  1. java股票数据_java抓取东方财富股票数据(附源码)

    背景 前段时间给朋友写了一个自动抓取同花顺股票数据的程序,不少人觉得不错. 这几天后台有粉丝给我留言让我也抓一下东方财富的数据,说东方财富的数据特别难抓,我还真不一定能搞得定. 本来我是一个德艺双磬且 ...

  2. java取网页数据_Java抓取网页数据(原来的页面+Javascript返回数据)

    转载请注明出处. 有时候因为种种原因.我们须要採集某个站点的数据.但因为不同站点对数据的显示方式略有不同! 本文就用Java给大家演示怎样抓取站点的数据:(1)抓取原网页数据.(2)抓取网页Javas ...

  3. 使用Chrome快速实现数据的抓取(二)——协议 - 天方 - 博客园

    使用Chrome快速实现数据的抓取(二)--协议 - 天方 - 博客园

  4. 强大的chrome(1)以acfun为例抓取视频

    chrome很强大,很强大,很强大. 想要了解他的强大呢,就先要掌握一些基本的chrome命令. 1. chrome://flags   可用来启用或者关闭某些chrome的体验特性   2. chr ...

  5. python chrome headless_实战Chrome Headless数据抓取(上)

    先聊聊数据抓取技术选型 在我看来数据抓取可以分为三种场景: 基本稳定的源站格式或者大量的数据抓取.需要蜘蛛集群调度:使用Java比较方便,可以用WebMagic抓取配合Hadoop调度,如果源站经常改 ...

  6. java 判断类型_如何快速入门Java编程学习(干货)

    一.初识Java 1.生活中的程序: 从起床到教室上课的过程 穿衣打扮>起床>洗漱>出宿舍>>吃早餐>到教室 按照特定的顺序去完成某一件事的过程我们叫做生活中的程序 ...

  7. java nio copy_使用NIO快速复制Java文件

    package com.test.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutpu ...

  8. python chrome headless_[技巧] chrome headless 爬虫抓取websoket 数据

    目录 源起 分析 实践 总结 源起 周末答应了一个朋友帮他看一下一个网站应该怎么爬,费话不说直接先上网站 https://datacenter.jin10.com/price 数据一直在不停的闪,直觉 ...

  9. java速学_5分钟快速入门Java,不看真的可惜了

    你好,世界! 源代码组织方式 Java程序由package+class组成,package对应目录的相对路径,class对应文件,如 关于class有如下几点规则: 文件的名字必须和class的名字一 ...

最新文章

  1. 图像集存储成MNIST数据集格式实现
  2. GIS讲堂第二课-地图切片简介以及OL中的调用
  3. mysql启动多端口
  4. flask ai 简单语音对话
  5. MySQL5.7版本64位下载及安装详细教程
  6. win10开始菜单 此计算机,如何将win10电脑中的开始菜单设置成智能版
  7. 个人整理的免费的Bootstrap模板
  8. upyun java_又拍云Java SDK使用
  9. FileZilla Server源码分析--大漠落日5节
  10. 黑白图片复原为彩色Picture Colorizer(图片着色器)
  11. 微场景:移动互联时代的营销革命
  12. 在线秒表 - 在线计时器 - 在线记时器
  13. JAVA使用POL导入Excel解决数据精度问题
  14. 泡泡一分钟:BLVD: Building A Large-scale 5D Semantics Benchmark for Autonomous Driving
  15. 安霸预发布14nm工艺的ISP芯片
  16. scrapy爬取——阿里招聘信息
  17. 洛谷P4315 月下“毛景树” 题解
  18. python 查找字符串
  19. 命令行卡到composer Updating dependencies (including require-dev)解决办法
  20. 蓝桥杯python省赛冲刺篇2——常用算法的详细解析及对应蓝桥杯真题:打表模拟法、递推递归法、枚举法、贪心算法、差分与前缀和

热门文章

  1. ANSYS——对称模型对称边界的确定以及对称边界的约束施加问题
  2. matlab 捕食者和猎物,MATLAB - 追求曲线(捕食者/猎物)
  3. 傅里叶变换应用——信号调制与解调
  4. Shell 示例:利用 $RANDOM 产生随机整数
  5. jquery插件之jquery-ui
  6. Lattice 的 Framebuffer IP核使用调试笔记之datasheet笔记
  7. jquery不同版本冲突导致低版本功能不能用
  8. 浅析Page.LoadTemplate(模板)方法动态获取绑定模板后,通过FindControl获取服务端控件的方法。...
  9. matlab guidata两个,Matlab
  10. 移远EC20 4G模块LTE开发板三网通模块 MQTT阿里云物联网