JavaScript 炫酷第一步 抓取别人网站数据
//访问这个网站 并打开控制台https://en.wikipedia.org/wiki/Category:Boulevards_in_Paris 审查元素后我们发现
他的selector对应
'#mw-pages > div'
所以第一行代码有了
const category = document.querySelector('#mw-pages > div');
根据分析得来
我们要拿a标签的数据
第二行代码有了
const allALink = category.querySelectorAll('a');
我们可以对原数组进行一个copy 然后再对新的数组进行操作
(这一步就显得你会的很多 但是其实不这么做也没有事情)
第三行代码
const links = Array.from(allALink);
我们想抓取关于带de的数据
第五行代码来了
const de = links.map(link => link.textContent).filter(streetName => streetName.includes('de'));
刘师傅?你要不要看下你抓了什么数据
console.table(de)
总结下来代码
console.log("提取别人网站的数据")
const category = document.querySelector('#mw-pages > div');
const allALink = category.querySelectorAll('a');
// console.log(allALink)
const links = Array.from(allALink);// console.log(links)
const de = links.map(link => link.textContent).filter(streetName => streetName.includes('de'));
console.table(de)
效果
欸嘿嘿 非常的完整
JavaScript 炫酷第一步 抓取别人网站数据相关推荐
- 抓取国外网站数据合法吗?法律分析
在互联网时代,数据是一种非常珍贵的资源,而获取数据的方式也越来越多样化.抓取(爬虫)国外网站数据是一种获取数据的常见方式.然而,抓取国外网站数据是否合法呢?这是一个备受争议的话题.本文将从法律.道德. ...
- [Python爬虫] 之二十二:Selenium +phantomjs 利用 pyquery抓取界面网站数据
一.介绍 本例子用Selenium +phantomjs爬取界面(https://a.jiemian.com/index.php?m=search&a=index&type=news& ...
- 爬虫演练-动态的抓取cp网站数据的演练-注意要反爬
练习接口地址 一分一变 https://50085cp.com/plan/api.do?code=og1k3&plan=0&size=20&planSize=20&_t ...
- python爬取qq音乐歌曲链接为什么播放不出来_手把手教你使用Python抓取QQ音乐数据(第一弹)...
原标题:手把手教你使用Python抓取QQ音乐数据(第一弹) [一.项目目标] 获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 由浅入深,层层递进,非常适合刚入门的同学练手. ...
- 如何使用浏览器控制台通过JavaScript抓取并将数据保存在文件中
by Praveen Dubey 通过Praveen Dubey 如何使用浏览器控制台通过JavaScript抓取并将数据保存在文件中 (How to use the browser console ...
- 微信好友大揭秘,使用Python抓取朋友圈数据,通过人脸识别全面分析好友,一起看透你的“朋友圈”...
微信:一个提供即时通讯服务的应用程序,更是一种生活方式,超过数十亿的使用者,越来越多的人选择使用它来沟通交流. 不知从何时起,我们的生活离不开微信,每天睁开眼的第一件事就是打开微信,关注着朋友圈里好友 ...
- python正则匹配找到所有的浮点数_如何利用Python抓取静态网站及其内部资源
遇到的需求 前段时间需要快速做个静态展示页面,要求是响应式和较美观.由于时间较短,自己动手写的话也有点麻烦,所以就打算上网找现成的. 中途找到了几个页面发现不错,然后就开始思考怎么把页面给下载下来. ...
- selenium抓取动态网页数据
1.selenium抓取动态网页数据基础介绍 1.1 什么是AJAX AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进 ...
- selenium抓取_使用Selenium的网络抓取电子商务网站
selenium抓取 In this article we will go through a web scraping process of an E-Commerce website. I hav ...
最新文章
- 单位员工通讯录管理系统(线性表的应用)
- 成功解决Runtime Error Selected KDE bandwidth is 0. Cannot estiam
- vc调用mysql数据库操作例子
- elk中kibana中如何显示写入elasticsearch的数据
- 正在直播 | 美女小编带你看2019世界人工智能大会
- 二级联动菜单ajax刷新,jquery json ajax 二级联动菜单实例
- laravel 模型事件几种用法
- KINDEDITOR取值并写入数据库的操作
- C#中winform怎么在线预览PDF,预览网上的PDF控件!不用安装Adobe PDF Reader等等其他,方案记录
- 【cofface】酷派手机升级助手Coolpad Download Assistant图文教程
- MyBatis整合Spring的实现(7)
- jquery表格日历写入html代码,基于jQuery日历插件制作日历
- iPhone的设置中,找不到“开发者选项”
- qq修改实名认证已达上限_王者荣耀实名认证系统,怎么二次修改
- 精品微信小程序预约挂号小程序+后台管理系统|前后分离VUE
- 泡泡 shader graph unity
- yolov算法详解_YOLOv4算法解读(思维导图)和论文翻译
- CHIL-SQL-NOW() 函数
- 督办督查局APP隐私策略
- Matlab二维热传导方程求解
热门文章
- 远程桌面协议(RDP)工具 FreeRDP
- 健身教程APP开发解决方案
- 广东迅视 第九届“五洲工业发展论坛”在深圳举办
- Neo4j 第一篇:在Windows环境中安装Neo4j
- 网关技术详解及常见网关对比
- Newtonsoft.Json.JsonConvert.SerializeObject()
- Kubernetes弃用Docker?关于Kubernetes、Docker和containerd的那些事
- 从C++转向Rust:两大主题值得关注!
- Chrome 70 将继续在地址栏隐藏网址中的 WWW
- i3-10110U和i5 10210u 哪个好