//访问这个网站 并打开控制台https://en.wikipedia.org/wiki/Category:Boulevards_in_Paris
审查元素后我们发现

他的selector对应

'#mw-pages > div'

所以第一行代码有了

const category = document.querySelector('#mw-pages > div');

根据分析得来

我们要拿a标签的数据

第二行代码有了

const allALink = category.querySelectorAll('a');

我们可以对原数组进行一个copy 然后再对新的数组进行操作
(这一步就显得你会的很多 但是其实不这么做也没有事情)
第三行代码

const links = Array.from(allALink);

我们想抓取关于带de的数据

第五行代码来了

const de = links.map(link => link.textContent).filter(streetName => streetName.includes('de'));

刘师傅?你要不要看下你抓了什么数据

 console.table(de)

总结下来代码

console.log("提取别人网站的数据")
const category = document.querySelector('#mw-pages > div');
const allALink = category.querySelectorAll('a');
// console.log(allALink)
const links = Array.from(allALink);// console.log(links)
const de = links.map(link => link.textContent).filter(streetName => streetName.includes('de'));
console.table(de)

效果

欸嘿嘿 非常的完整

JavaScript 炫酷第一步 抓取别人网站数据相关推荐

  1. 抓取国外网站数据合法吗?法律分析

    在互联网时代,数据是一种非常珍贵的资源,而获取数据的方式也越来越多样化.抓取(爬虫)国外网站数据是一种获取数据的常见方式.然而,抓取国外网站数据是否合法呢?这是一个备受争议的话题.本文将从法律.道德. ...

  2. [Python爬虫] 之二十二:Selenium +phantomjs 利用 pyquery抓取界面网站数据

    一.介绍 本例子用Selenium +phantomjs爬取界面(https://a.jiemian.com/index.php?m=search&a=index&type=news& ...

  3. 爬虫演练-动态的抓取cp网站数据的演练-注意要反爬

    练习接口地址 一分一变 https://50085cp.com/plan/api.do?code=og1k3&plan=0&size=20&planSize=20&_t ...

  4. python爬取qq音乐歌曲链接为什么播放不出来_手把手教你使用Python抓取QQ音乐数据(第一弹)...

    原标题:手把手教你使用Python抓取QQ音乐数据(第一弹) [一.项目目标] 获取 QQ 音乐指定歌手单曲排行指定页数的歌曲的歌名.专辑名.播放链接. 由浅入深,层层递进,非常适合刚入门的同学练手. ...

  5. 如何使用浏览器控制台通过JavaScript抓取并将数据保存在文件中

    by Praveen Dubey 通过Praveen Dubey 如何使用浏览器控制台通过JavaScript抓取并将数据保存在文件中 (How to use the browser console ...

  6. 微信好友大揭秘,使用Python抓取朋友圈数据,通过人脸识别全面分析好友,一起看透你的“朋友圈”...

    微信:一个提供即时通讯服务的应用程序,更是一种生活方式,超过数十亿的使用者,越来越多的人选择使用它来沟通交流. 不知从何时起,我们的生活离不开微信,每天睁开眼的第一件事就是打开微信,关注着朋友圈里好友 ...

  7. python正则匹配找到所有的浮点数_如何利用Python抓取静态网站及其内部资源

    遇到的需求 前段时间需要快速做个静态展示页面,要求是响应式和较美观.由于时间较短,自己动手写的话也有点麻烦,所以就打算上网找现成的. 中途找到了几个页面发现不错,然后就开始思考怎么把页面给下载下来. ...

  8. selenium抓取动态网页数据

    1.selenium抓取动态网页数据基础介绍 1.1 什么是AJAX AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进 ...

  9. selenium抓取_使用Selenium的网络抓取电子商务网站

    selenium抓取 In this article we will go through a web scraping process of an E-Commerce website. I hav ...

最新文章

  1. 单位员工通讯录管理系统(线性表的应用)
  2. 成功解决Runtime Error Selected KDE bandwidth is 0. Cannot estiam
  3. vc调用mysql数据库操作例子
  4. elk中kibana中如何显示写入elasticsearch的数据
  5. 正在直播 | 美女小编带你看2019世界人工智能大会
  6. 二级联动菜单ajax刷新,jquery json ajax 二级联动菜单实例
  7. laravel 模型事件几种用法
  8. KINDEDITOR取值并写入数据库的操作
  9. C#中winform怎么在线预览PDF,预览网上的PDF控件!不用安装Adobe PDF Reader等等其他,方案记录
  10. 【cofface】酷派手机升级助手Coolpad Download Assistant图文教程
  11. MyBatis整合Spring的实现(7)
  12. jquery表格日历写入html代码,基于jQuery日历插件制作日历
  13. iPhone的设置中,找不到“开发者选项”
  14. qq修改实名认证已达上限_王者荣耀实名认证系统,怎么二次修改
  15. 精品微信小程序预约挂号小程序+后台管理系统|前后分离VUE
  16. 泡泡 shader graph unity
  17. yolov算法详解_YOLOv4算法解读(思维导图)和论文翻译
  18. CHIL-SQL-NOW() 函数
  19. 督办督查局APP隐私策略
  20. Matlab二维热传导方程求解

热门文章

  1. 远程桌面协议(RDP)工具 FreeRDP
  2. 健身教程APP开发解决方案
  3. 广东迅视 第九届“五洲工业发展论坛”在深圳举办
  4. Neo4j 第一篇:在Windows环境中安装Neo4j
  5. 网关技术详解及常见网关对比
  6. Newtonsoft.Json.JsonConvert.SerializeObject()
  7. Kubernetes弃用Docker?关于Kubernetes、Docker和containerd的那些事
  8. 从C++转向Rust:两大主题值得关注!
  9. Chrome 70 将继续在地址栏隐藏网址中的 WWW
  10. i3-10110U和i5 10210u 哪个好