<html> <head> <mce:script type="text/javascript"><!-- var xmlHttp; //创建XMLHttpRequest对象。 function createXMLHttpRequest() { if (window.ActiveXObject) { xmlHttp = new ActiveXObject("Microsoft.XMLHTTP"); } else if (window.XMLHttpRequest) { xmlHttp = new XMLHttpRequest(); } } function startRequest(year) { createXMLHttpRequest(); xmlHttp.onreadystatechange = handleStateChange; xmlHttp.open("GET", "http://map.zhcw.com/ssq/ssq/changgui_asc.jsp?size=" + year, true);// xmlHttp.send(null);//发送该请求 } //处理请求 function handleStateChange() { if(xmlHttp.readyState == 4) { if(xmlHttp.status == 200) { var s = xmlHttp.responseText; // 去掉之前没有用的 s = s.substring(s.indexOf("/ssq/ssq/changgui.jsp?size=")); s = s.replace(//s/g,""); // 显示到页面 document.getElementById("dataDiv").innerHTML=parse(s); } } } function parse(s) { // 匹配数据 ">数字< " 或 "> &nbsp; < " 或 "> &nbsp;数字&nbsp; < " 或 ">数字:数字<" var reg = new RegExp(">(((&nbsp;)*[0-9]+(&nbsp;)*)|(&nbsp;)|([0-9]+([:][0-9]+)+))<","g"); var r = s.match(reg); var sb = ""; for(var i = 0; i< r.length;i++) { // 去掉>< var a = r[i].substring(1,r[i].length - 1); // 解决蓝球号 &nbsp;13 的情况 即去掉13前面的 &nbsp; if(a.indexOf("nbsp") > 0 && a.length > 6) { a = a.substring(6); } a = a.replace(/&nbsp;/g, "--"); sb +=a; sb +="|"; // 每行有19个数据 if (i != 0 && (i + 1) % 19 == 0) { sb +="<br>"; } } return sb; } // --></mce:script> </head> <body> <a href="javascript:startRequest(2003);" mce_href="javascript:startRequest(2003);">2003</a> <br/> <a href="javascript:startRequest(2004);" mce_href="javascript:startRequest(2004);">2004</a> <br/> <a href="javascript:startRequest(2005);" mce_href="javascript:startRequest(2005);">2005</a> <br/> <a href="javascript:startRequest(2006);" mce_href="javascript:startRequest(2006);">2006</a> <br/> <a href="javascript:startRequest(2007);" mce_href="javascript:startRequest(2007);">2007</a> <br/> <a href="javascript:startRequest(2008);" mce_href="javascript:startRequest(2008);">2008</a> <br/> <a href="javascript:startRequest(2009);" mce_href="javascript:startRequest(2009);">2009</a> <br/> <div id="dataDiv"></div> </body> </html>

保存html即可

如何从福彩官网抓取 双色球历史数据相关推荐

  1. 【Python爬虫】利用爬虫抓取双色球开奖号码,获取完整数据,简洁45行代码实现,更新时间2023-06-28

    链接:https://pan.baidu.com/s/18oE308_NVNPaCOACw_H5Hw?pwd=abc1 利用爬虫抓取双色球开奖号码,获取完整数据,简洁45行代码实现,更新时间2023- ...

  2. 获取页眉值vba_VBA抓取股票历史数据的整体表处理

    大家好,我们今日讲解"VBA抓取股票历史数据的整体表处理",这节内容是"VBA信息获取与处理"教程中第六个专题"VBA中利用XMLHTTP完成网抓数据 ...

  3. php好趣网抓取_PHP抓取卫视直播源

    以下代码只用于个人娱乐,请勿用于商业用途,否则后果自负. 由于业余爱好,花了点时间用php+simple_html_dom 类库,简单实现了抓取好趣网的各卫视等直播源,simpleHtmlDOM类请至 ...

  4. 使用Jsoup去国家统计局官网爬取省市县三级json数据

    使用Jsoup.多线程去国家统计局官网获取全国省市县三级json数据: package com.imant.crawler.controller;import com.google.common.ut ...

  5. python爬虫抓取双色球_Python爬虫练习:爬取双色球每期的中奖号码,看能不能中奖...

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于CSDN ,作者嗨学编程 确定URL 请求网页 http://www.cwl. ...

  6. 搜索引擎核心读书心得2:暗网抓取

    所谓的暗网在上篇文章已经简单介绍,是指目前搜索引擎爬虫按照常规方式很难抓取到的网页.在网络中很多网站的内容是以数据库方式进行存储的,而搜索引擎爬虫依赖页面中的链接关系发现新页面.比例携程网中的机票数据 ...

  7. 官网拉取fuchsia代码

    cd ~ curl -s "https://fuchsia.googlesource.com/fuchsia/+/HEAD/scripts/bootstrap?format=TEXT&quo ...

  8. [HOW TO]-官网拉取Trusty-TEE的代码

    快速链接: .

  9. 20行python代码入门网络爬虫全流程:使用BeautifulSoup抓取当日人民银行外汇数据

    网路爬虫是python最重要的应用之一,甚至有很多地方认为python就是用来做网抓的.这里将用大约20行代码展示一个从人民银行官网抓取当日人民币美元汇率的示例来入门这项技术. 和我们平时手动上网寻找 ...

  10. python简单实现抓取英雄联盟皮肤原画:老玩家都哭了!

    写在前面: 自学py已经快两个多月了吧,作为新手,就是敢于尝试,之前有看到有人抓取王者荣耀皮肤的,但是作为一个联盟老玩家,还是想搞一个抓取联盟皮肤的,下面分享一下我自己的学习经过,如果有错误或者建议, ...

最新文章

  1. 客户资料查询传递数据格式
  2. flask_sqlalchemy 多对多重复插入解决办法
  3. Visual C++ 菜单
  4. 一行代码让你的python运行速度提高100倍
  5. JavaScript从入门到放弃 -(六)正则表达式
  6. Kafka MirrorMaker2.0 (异地双活/跨数据中心容灾/跨集群容灾)
  7. 计算机网络课程优秀备考PPT之第一章概述(一)
  8. pthread_cancel
  9. [转]在VS2010 VC++项目中引用Lib静态库(以Openssl为例)
  10. 计算机网络自顶向下 1
  11. krohne流量计接线图_电磁流量计接线方式
  12. mysql数据库自动备份软件SQLBackupAndFTP简介(图文)
  13. 黑马程序员前端JavaScript高级——ES6学习笔记
  14. 笨方法学python在线_“笨办法”学Python(第3版)
  15. 第七届“华文奖”开展 特设主题向余光中致敬
  16. 1m=1000ms(1秒等于一千毫秒)
  17. 常数和基本初等函数的导数
  18. ONES Talk | 我们为什么选择最难走的软件之路
  19. spring简单实现打印机功能,详细思路分析 小白上手
  20. 笔记 MIT6.824 Lecture 17: COPS, Causal Consistency

热门文章

  1. c9大学计算机系好的大学,C9顶尖高校所有自主招生专业大汇总
  2. 解决onenote同步速度慢问题
  3. 韩国历史最悠久的银行推出全国区块链贷款平台
  4. scrapy 报错401
  5. 【JavaSE8 高级编程 多线程】多线程入门级解析 2019_7_27
  6. 褚时健去世,柳传志发悼词:我非常钦佩褚老
  7. ubuntu 下使用unixbench 这种benchmark 工具测试系统性能
  8. 《伯克毕生发展心理学2》
  9. 带轮轮毂长度l和带轮宽b表_V带轮宽度怎么计算?知道是A型带,带数为6,轮缘宽、轮彀孔径与长度怎么计算?顺求公式...
  10. ipc$与默认共享及ipc$连接失败的原因