2019独角兽企业重金招聘Python工程师标准>>>

get方式获取网页中的链接

var http = require('http');//定义函数
var getAHref = function(htmlstr){var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim;var arr = [];while(tem=reg.exec(htmlstr)){arr.push(tem[2]);}return arr;
}var qHref = "http://xxx";//设置被查询的目标网址var req = http.get(qHref, function(res) {var pageData = "";res.setEncoding('utf8');res.on('error', function (errget) {//出错处理});res.on('data', function (chunk) {pageData += chunk;});res.on('end', function(){//console.dir(pageData);var content = pageData;//获取到网页内容var hrefs=getAHref(content);//获取链接});});

转载自:http://www.9958.pw/post/nodejs_get_html_a

转载于:https://my.oschina.net/u/1179286/blog/651057

node.js用get方式获取网页中的链接相关推荐

  1. java 获取js html_JS获取网页中HTML元素的几种方法

    编写js程序的时候最常使用的就是获取网页中的html元素,并进行处理,我在网上发现了一篇获取html对象的几种方法进行整理的帖子,发上来大家一块学习~ getElementById getElemen ...

  2. php如何获取图片地址,js如何直接获取网页中图片地址

    这次给大家带来js如何直接获取网页中图片地址,js直接获取网页中图片地址的注意事项有哪些,下面就是实战案例,一起来看一下. 第一种方法:js通过正则实现/** * 获取html代码中图片地址 * @p ...

  3. Android WebView获取网页中JavaScript弹框内容

    Android WebView获取网页中JavaScript弹框内容 网页中弹窗的js代码为 <script type="text/javascript" language= ...

  4. python requests 动态加载_Python获取网页中动态加载的数据

    Python获取网页中动态加载的数据 0.XHR 是什么? XHR是 XMLHttpRequest 对象.既Ajax功能实现所依赖的对象,在JQuery中的Ajax是对 XHR的封装. 1.查看异步加 ...

  5. JAVA获取网页中的电影下载地址小程序

    现在电影资源越来越少了,今天想看看吸血鬼日记,结果网上搜出的网址不支持迅雷批量下载,我一个一个点,很累.于是就看看网页源代码发现影片都以FTP开头,rmvb结尾.于是就写了个小程序能够获取网页中所有的 ...

  6. 如何批量获取网页中的下载链接

    tips:下载 chrome json 正则表达式 如何批量获取网页中的下载链接 前言 打开你要下载的网页 二.获取网页的json数据 1.获取网页的源码 2.选取json 3.获取json字符串 4 ...

  7. python读取图片分辨率_python获取网页中所有图片并筛选指定分辨率的方法

    压测时,图片太少,想着下载网页中的图片,然后过滤指定分辨率,但网页中指定分辨率的图片太少了(见下) 后使用格式工厂转换图片 import urllib.request # 导入urllib模块 imp ...

  8. js使用slice方法获取数组中某段元素

    js使用slice方法获取数组中某段元素 slice() 方法可从已有的数组中返回选定的元素. 语法:arrayObj.slice(start, [end]) 参数: start:必需.规定从何处开始 ...

  9. node.js 爬虫 实现爬取网页图片并保存到本地

    node.js 爬虫 实现爬取网页图片并保存到本地 没有废话直接看代码 /*** 请求网站数据* 将数据保存本地文件*/ //不同协议引用不同模块,http https const http = re ...

最新文章

  1. python3 windows环境 安装加密库 crypto
  2. MapReduce算法–了解数据连接第二部分
  3. 关于有多少个1的计算
  4. 【youcans 的 OpenCV 例程 200 篇】101. 自适应中值滤波器
  5. 合肥python招聘_2020年合肥京东方招聘官网招聘-合肥京东方招聘官网招聘求职信息-拉勾招聘...
  6. Net中的AOP系列之《将AOP作为架构工具》
  7. 密实逃脱1深红色房间攻略
  8. Ant + Jenkies +Tomcat 自动构建部署Web项目
  9. 拓端tecdat|matlab使用Copula仿真优化市场风险数据VaR分析
  10. 部署python爬虫_爬虫项目部署
  11. JS点击按钮复制文本
  12. 列表展示:RecyclerView多条目
  13. 编写一个能将给定非负整数列表中的数字排列成最大数字的函数。
  14. 鸟哥LINUX操作练习(8):Linux 磁盘与文件系统管理
  15. T细胞培养方法进展及方法学对比
  16. [模板匹配霍夫变换]——模板匹配分析、霍夫变换分析
  17. 为什么说人生低谷期是最好的增值期?
  18. Unity存档系统——Json格式的文件
  19. 春运火车票开抢,最强攻略请注意查收
  20. 融跃财经:美股收高,苹果股价创新高!

热门文章

  1. Python函数中参数* 和 ** 的区别
  2. C正数负数的原码补码反码以及内存地址分析
  3. CSS3动画常用贝塞尔曲线-效果演示
  4. 前端开发之模块化初探
  5. Hadoop环境 IDE配置(在eclipse中安装hadoop-eclipse-plugin-2.7.3.jar插件)
  6. OpenSSH 远程拒绝服务漏洞
  7. C++ passes by reference, Java and Ruby don’t
  8. 产品经理必读:用户场景分析的四要素
  9. php版本个版本区别,PHP版本不一样有什么区别
  10. mysql执行的list_CMD如何进入Mysql命令并执行相关查询