最近在做一个足球数据爬虫,连接的是某常用足球比分直播平台的网站。在抓取的过程中方法很简单。打开网页地址,进入开发者模式,查看其数据加载。

发现其比分数据是采用获取平台js文件的方式从服务器下载下来然后执行js进行比分展现的.仅供交流学习用。

使用jsoup开源框架进行获取,在代码中合理的设置header。代码如下:

解析方法如下:

输出结果:

又或者使用以下方法解析,但相对复杂,没有上述方法来的优雅,显得繁琐难懂:

转载于:https://blog.51cto.com/13876516/2146883

JAVA爬虫--JS文件数据快速解析相关推荐

  1. java解析comtrade文件_一种COMTRADE二进制数据文件的快速解析方法与流程

    本发明涉及电子系统录波领域,更具体地,涉及一种COMTRADE二进制数据文件的快速解析方法. 背景技术: 近年来,随着电子技术的快速发展,电力系统暂态录波明显向高采样率.连续稳态记录和海量存储的趋势发 ...

  2. js将数据存储到mysql_使用java读取js文件,将数据写入数据库

    packagecn.itcast.day04.test;/**参数说明:java -jar InsertData.jar 数据库url 表名 文件路径 是否再插入前删除 该方法存在的问题是,读入本地数 ...

  3. Facebook Java爬虫获取视频数据

    前言部分 前置说明 ​ 截止到本文发表前,该爬虫方法因为htmlunit的问题,已经无法正常运行,由于本人后续不再维护相关功能,所以不会修复此问题.如果是迫切需要解决方案的读者可以忽略本文,寻求其它解 ...

  4. java spring js文件_005-html+js+spring multipart文件上传

    一.概述 需求:通过html+js+java上传最大500M的文件,需要做MD5 消息摘要以及SHA256签名,文件上传至云存储 1.1.理解http协议 https://www.cnblogs.co ...

  5. java操作js文件_JS操作文件

    1.用JS创建文件 var fso, f1; fso = new ActiveXObject("Scripting.FileSystemObject"); f1 = fso.Cre ...

  6. python读数据-python读取各种文件数据方法解析

    python读取.txt(.log)文件 ..xml 文件 .excel文件数据,并将数据类型转换为需要的类型,添加到list中详解 1.读取文本文件数据(.txt结尾的文件)或日志文件(.log结尾 ...

  7. java爬虫异步取数据_教您使用java爬虫gecco抓取JD全部商品信息(三)

    ##详情页抓取 商品的基本信息抓取完成后,就要针对每个商品的详情页进行抓取,可以看到详情页的地址格式一般如下:http://item.jd.com/1861098.html.我们建立商品详情页的Bea ...

  8. Java读取Excel文件数据并将记录写入到新的文件中--POI技术实现

    1. apache poi包里有4个主要的类: Workbook----工作表,通过WorkbookFactory的create(FileInputStream fis)方法获取, Sheet---- ...

  9. java获取vdx文件数据_通过文件名获取文件类型ContentType

    第一种方法: 引用System.Web.dll v4.5,就可以通过var mimeType = MimeMapping.GetMimeMapping(fileName);直接获取文件类型 第二种方法 ...

最新文章

  1. Apache,php,mysql整合安装包 for Windows 2000/xp/2003
  2. 全面解析RS232、RS485、RS422、RJ45接口的区别和各自的应用
  3. pci总线定时协议_汽车总线测试的“解忧杂货店”
  4. 每周一个 Python 模块 | hashlib
  5. 使用 OpenCL.Net 进行 C# GPU 并行编程
  6. DefaultIfEmpty
  7. 内网外网同时连接方法
  8. Spring-data-redis操作redis知识总结
  9. linux shell有哪些变量,Linux Bash Shell有关变量
  10. pycharm2019版本去掉下划线的方法
  11. 嵌入式三大职业发展方向
  12. C语言期末复习不挂科(快速入门)(和bug郭一起学C系列1)
  13. 《Region Proposal by Guided Anchoring》论文笔记
  14. SAS,软件使用中reg报错/gplot错误的解决方法。
  15. 自动生产线实训考核装备
  16. 钉钉应用云开发之钉钉开放平台接入
  17. echarts label点击_echarts 点击方法总结,点任意一点获取点击数据,举例说明:在多图联动中点击绘制标线...
  18. 凡客登录页面html代码,简洁的凡客购物商城首页模板源码
  19. 免费搜索引擎登陆入口大全-中文
  20. JAVA线程池 -clt设计与分析

热门文章

  1. S4 HANA物料凭证表MATDOC
  2. 「SAP技术」MIGO 343 解冻物料库存的同时可以更改存储地点
  3. 吴恩达机器学习笔记 —— 8 正则化
  4. np.max()和np.argmax()
  5. 为啥辣椒会辣得人嘴巴疼?这个问题竟然和今年诺奖有关
  6. 李飞飞AI100报告第二弹,提出14大AI机遇与挑战,82页pdf
  7. 论文速递:智能作为信息处理系统
  8. 学科交叉是科学发展的必然趋势
  9. 里程碑式的数学证明,攻破著名Erdős猜想中关键障碍
  10. 防止被算力“锁死”,人工智能进化急需革命性算法