node.js用get方式获取网页中的链接
2019独角兽企业重金招聘Python工程师标准>>>
get方式获取网页中的链接
var http = require('http');//定义函数
var getAHref = function(htmlstr){var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim;var arr = [];while(tem=reg.exec(htmlstr)){arr.push(tem[2]);}return arr;
}var qHref = "http://xxx";//设置被查询的目标网址var req = http.get(qHref, function(res) {var pageData = "";res.setEncoding('utf8');res.on('error', function (errget) {//出错处理});res.on('data', function (chunk) {pageData += chunk;});res.on('end', function(){//console.dir(pageData);var content = pageData;//获取到网页内容var hrefs=getAHref(content);//获取链接});});
转载自:http://www.9958.pw/post/nodejs_get_html_a
转载于:https://my.oschina.net/u/1179286/blog/651057
node.js用get方式获取网页中的链接相关推荐
- java 获取js html_JS获取网页中HTML元素的几种方法
编写js程序的时候最常使用的就是获取网页中的html元素,并进行处理,我在网上发现了一篇获取html对象的几种方法进行整理的帖子,发上来大家一块学习~ getElementById getElemen ...
- php如何获取图片地址,js如何直接获取网页中图片地址
这次给大家带来js如何直接获取网页中图片地址,js直接获取网页中图片地址的注意事项有哪些,下面就是实战案例,一起来看一下. 第一种方法:js通过正则实现/** * 获取html代码中图片地址 * @p ...
- Android WebView获取网页中JavaScript弹框内容
Android WebView获取网页中JavaScript弹框内容 网页中弹窗的js代码为 <script type="text/javascript" language= ...
- python requests 动态加载_Python获取网页中动态加载的数据
Python获取网页中动态加载的数据 0.XHR 是什么? XHR是 XMLHttpRequest 对象.既Ajax功能实现所依赖的对象,在JQuery中的Ajax是对 XHR的封装. 1.查看异步加 ...
- JAVA获取网页中的电影下载地址小程序
现在电影资源越来越少了,今天想看看吸血鬼日记,结果网上搜出的网址不支持迅雷批量下载,我一个一个点,很累.于是就看看网页源代码发现影片都以FTP开头,rmvb结尾.于是就写了个小程序能够获取网页中所有的 ...
- 如何批量获取网页中的下载链接
tips:下载 chrome json 正则表达式 如何批量获取网页中的下载链接 前言 打开你要下载的网页 二.获取网页的json数据 1.获取网页的源码 2.选取json 3.获取json字符串 4 ...
- python读取图片分辨率_python获取网页中所有图片并筛选指定分辨率的方法
压测时,图片太少,想着下载网页中的图片,然后过滤指定分辨率,但网页中指定分辨率的图片太少了(见下) 后使用格式工厂转换图片 import urllib.request # 导入urllib模块 imp ...
- js使用slice方法获取数组中某段元素
js使用slice方法获取数组中某段元素 slice() 方法可从已有的数组中返回选定的元素. 语法:arrayObj.slice(start, [end]) 参数: start:必需.规定从何处开始 ...
- node.js 爬虫 实现爬取网页图片并保存到本地
node.js 爬虫 实现爬取网页图片并保存到本地 没有废话直接看代码 /*** 请求网站数据* 将数据保存本地文件*/ //不同协议引用不同模块,http https const http = re ...
最新文章
- python3 windows环境 安装加密库 crypto
- MapReduce算法–了解数据连接第二部分
- 关于有多少个1的计算
- 【youcans 的 OpenCV 例程 200 篇】101. 自适应中值滤波器
- 合肥python招聘_2020年合肥京东方招聘官网招聘-合肥京东方招聘官网招聘求职信息-拉勾招聘...
- Net中的AOP系列之《将AOP作为架构工具》
- 密实逃脱1深红色房间攻略
- Ant + Jenkies +Tomcat 自动构建部署Web项目
- 拓端tecdat|matlab使用Copula仿真优化市场风险数据VaR分析
- 部署python爬虫_爬虫项目部署
- JS点击按钮复制文本
- 列表展示:RecyclerView多条目
- 编写一个能将给定非负整数列表中的数字排列成最大数字的函数。
- 鸟哥LINUX操作练习(8):Linux 磁盘与文件系统管理
- T细胞培养方法进展及方法学对比
- [模板匹配霍夫变换]——模板匹配分析、霍夫变换分析
- 为什么说人生低谷期是最好的增值期?
- Unity存档系统——Json格式的文件
- 春运火车票开抢,最强攻略请注意查收
- 融跃财经:美股收高,苹果股价创新高!
热门文章
- Python函数中参数* 和 ** 的区别
- C正数负数的原码补码反码以及内存地址分析
- CSS3动画常用贝塞尔曲线-效果演示
- 前端开发之模块化初探
- Hadoop环境 IDE配置(在eclipse中安装hadoop-eclipse-plugin-2.7.3.jar插件)
- OpenSSH 远程拒绝服务漏洞
- C++ passes by reference, Java and Ruby don’t
- 产品经理必读:用户场景分析的四要素
- php版本个版本区别,PHP版本不一样有什么区别
- mysql执行的list_CMD如何进入Mysql命令并执行相关查询