一起学爬虫(Python) — 19 年轻人,进来学自动化

前言

想了想,有个事情小泽得跟大家报备下,估计很多人也猜到了,是的,我准备当一个鸽子 去学校找一个人,其实前几天我妹刚跟我说这事的时候,我也没想太清楚,就去随便找了小孩子试了试,后面也参加了几场群架,感觉还提得动刀,就答应了,因为毕竟我妹是跟我感情一般往上的生物,不管结果如何,当她需要我的时候,我还是希望她能好好地求求我,帮她稍微解决那么一点不麻烦的事。

因此我会跟大家一起找到那个人,全力备战接下来的群架,也谢谢大家的支持!我会努力的/抱拳/抱拳

前因

事情是这样的,我妹周末放假回来,对了,先说一下,她只有初一哦,也就是12岁吧。

放假回来,立马就扑到我身,边的沙发上,蒙上被子就开始闷闷不乐,还要看着我,一直看着我,仿佛喜欢我 在看傻子。

我就问她,咋滴啦?

她就跟我说,要跟我说一件事情,还让我一定保密。

那我肯定泄密。

开玩笑的,我只会拿来当把柄而已。

这件事是什么呢?因为我答应了她不能泄密,所以我就用A,B,C来代替事中的人物,也就不算是泄密了。

顶级理解,对吧。

A喜欢B,B喜欢C,C跟A在一起了。

至于谁是谁,我就不告诉你了,只能说我人刚下飞机,有一说一,这种事大家懂得都懂,不懂得说了你也不明白,不如不说。利益相关,不好透漏太多,你们也别来问我怎么了,说了对你们也没什么好处,当不知道就行了。


所以我就要悄悄地去找到B,然后跟他说,我妹真的很傻X 加油吧,妹夫!

相信敏锐的你已经看出来了,我和我妹的关系,emmm,自我感觉是处于很不好的状态,这个很不好不是亲情方面的很不好,而是看不顺眼方面的很不好,那我能咋办嘛,人家喜欢年轻的。

我都20了。

呜呜呜┭┮﹏┭┮

不过我也不是妹控哈。

相反的我也挺讨厌她的,至于为什么,有妹妹的都能稍微感同身受到吧,把感同身受打在留言上。

现在呢,我就要开始去找那个小男生啦。

经过

那么我要怎么找呢???

首先,要知道他在哪一个学校。

不能泄密!所以这里就用第一中学代替了。

接下来呢,因为我妹是告诉的我他在那个年级的倒数第几个班哦,所以我只能先知道一共有多少个班了。


emm,看来是705这个班,也就是说我们通过学校,找到了他的年级,又找到了他的班级,现在我再给你详细的分析一下,这三个人,都在哪个班!


如果我们去这个学校,注意,是去这个学校!找B,那么该怎么找呢?

聪明的你一定会想到,跟门卫叔叔说我要找705班的B就好了,对吧。

那么为什么不说我要找初一里面的705班的B呢?

为什么为什么不说我要找第一中学初一里面的705班的B呢?

你傻啊 你好聪明啊。

这是我的个人观点,门卫叔叔可能就会觉得你有问题。

也就是说,B = //705/@B

这里为什么要用//呢,//代表的是省略前面的初中,如果初中前面还有东西,当然不是那个第一中学哦,因为我们已经在第一中学里面了,所以可以省略掉,直接用/代替第一中学,如果初中前面还有东西,就可以直接全部省略掉,只要你这个学校只有一个初中,那就肯定没找错。

为什么要@B呢?

你这样想,一个教室里面有那么多的东西,阿猫阿狗啊,二氧化碳还有氧气啊啥的,你不说清楚,谁知道你是要找人的呢,别跟我说常规,我现在化身为了不讲道理の霸道总裁。

同样的,换成查帕斯(xpath),给大家看一看效果。


这里为了大家看的方便,所以给每个标签后面都加了数字,实际是没有的哦,别搞迷糊了。

加入我们要去找a1,那该怎么找呢,最笨的方法:

/html/body/div1/div4/div6/a1

当然,这也只是找到了a1,如果a1里面有我们要的文本,那就:

/html/body/div1/div4/div6/a1/text()

如果a1里面有我们要的属性信息,比如:

那就把text()换成@href,或者@wdfield等等,需要啥@啥。

那有没有简单的方法直接找到a1呢,有的~


我们现在给这个div6加了一个class,然后其他的div都没有这个class嘛,就相当于火箭班,天才班之类的。

那就这样搞:

//div[@class=“main”]/a1

//呢,还是把前面的都省略掉了,直接来找这个class等于main的div,注意注意,这里面所有的符号都是英文的哦。

如果你在找一个网页的时候,实在是找不对xpath,就试试用这种脑图的方式记录下来,这样自己找的话也方便,也很有规划性,养成好习惯!

另外,复制的xpath有时候也会没有手写的好用哦。

当然要是真的找不到,写的也特别对的话,可能就是反爬措施吧,比如说有的人问某个班的谁谁谁可能是想卖掉他,所以这个时候校长就要验证一下你的身份信息,不然不让你进,更不会告诉你你要找的人是谁。

结果

大胜利!

我应该是有妹夫了嗷。

他们才12岁诶。

好落寞。

一起学爬虫(Python) — 18 一生之敌查帕斯相关推荐

  1. 老司机带你学爬虫——Python爬虫技术分享

    什么是"爬虫"? 简单来说,写一个从web上获取需要数据并按规定格式存储的程序就叫爬虫: 爬虫理论上步骤很简单,第一步获取html源码,第二步分析html并拿到数据.但实际操作,老 ...

  2. 01-为什么要学爬虫-python小白爬虫入门教程

    学习目的以及需求 需求来自于:抓取的某个网站或者某个应用的内容,提取有用的价值 实现手段 模拟用户在浏览器或者应用(app)上的操作,实现自动化的程序 爬虫应用场景(利用爬虫能做什么?) 大家最熟悉的 ...

  3. 一起学爬虫(Python) — 06

    一起学爬虫(Python) - 19 年轻人,进来学自动化 今天我们要停下来 回顾 xpath 什么是xpath 查帕斯的原理 案例 举一反三 回顾 鲁迅先生曾说过,学习要脚踏实地,要会举一反三!昨晚 ...

  4. 一起学爬虫(Python) — 15 进攻,有道翻译!

    一起学爬虫(Python) - 19 年轻人,进来学自动化 前言 Hello,大家好,这里是超级勤奋的小泽亲~ 因为不会用目录所以直接不用目录- 那么今天要干什么呢? 标题不都说了嘛,进攻,有道翻译! ...

  5. 路飞学城-Python 爬虫实战密训-第 1 章

    本节学习体会: 鸡汤心得: 1.时代发展太快,要不断学习新东西,武装自己,才能跟得上时代的潮流,不然就是面临被pass的命运 2.要看清楚趋势,不要闭门造车 3.学习编程语言就跟学英语一样,方法很重要 ...

  6. python初学者web还是爬虫-还在纠结学爬虫还是数据分析,不如看看这篇文章

    原标题:还在纠结学爬虫还是数据分析,不如看看这篇文章 身为职场人,收集上万条表格数据做商业分析,裁剪上千张图片,发送数百封邮件...这些都是经常会遇到的场景.我一直期待能有个工具解放我,直到我遇到了P ...

  7. python好学嘛-爬虫Python入门好学吗?学什么?

    爬虫Python入门好学吗?学爬虫需要具备一定的基础,有编程基础学Python爬虫更容易学.但要多看多练,有自己的逻辑想法.用Python达到自己的学习目的才算有价值.如果是入门学习了解,开始学习不难 ...

  8. 路飞学城—Python爬虫实战密训班 第三章

    路飞学城-Python爬虫实战密训班 第三章 一.scrapy-redis插件实现简单分布式爬虫 scrapy-redis插件用于将scrapy和redis结合实现简单分布式爬虫:- 定义调度器- 定 ...

  9. python是什么意思中文、好学吗-爬虫Python入门好学吗?学什么?

    爬虫Python入门好学吗?学爬虫需要具备一定的基础,有编程基础学Python爬虫更容易学.但要多看多练,有自己的逻辑想法.用Python达到自己的学习目的才算有价值.如果是入门学习了解,开始学习不难 ...

最新文章

  1. python json数据的文件读写操作
  2. 秋招必考——Batch Normalization精简解析
  3. Python爬虫入门:爬取某个网页的小说内容
  4. 七段式svpwm和5段式的区别_五段和七段SVPWM的比较分析.pdf
  5. C# xml通过xslt转换为html输出
  6. QML基础类型之vector3d
  7. qemu 对虚机的地址空间管理
  8. SAP Spartacus home page的三大section
  9. Ocelot.JwtAuthorize:一个基于网关的Jwt验证包
  10. C语言 函数值传递和址传递 - C语言零基础入门教程
  11. mxnet深度学习(NDArray)
  12. numpy求逆矩阵_线性代数精华2——逆矩阵的推导过程
  13. Postman的新手教学,一学就会!
  14. leetcode—9.分离双指针题型python解答
  15. 【项目总结】订单性质识别
  16. Java爬虫Jsoup篇
  17. EBU 4202数电 LAB2 答案与解析
  18. 使用MqttClient
  19. 高性能流媒体服务器--mediasoup框架整理
  20. Thoughtworks笔试作业

热门文章

  1. Unicode 编码范围和中文编码范围
  2. 1节课学会PS ,Adobe PhotoshopCS6超速入门
  3. 多个跨云服务器之间满带宽测速的一种实现方案
  4. php小数转百分数,PHP百分号转小数,php 小数转换百分数函数
  5. 解决硬盘/U盘乱码的问题
  6. 海康EHOME5.0协议无法成功注册EasyCVR平台的原因排查
  7. 《计算机组成原理》第二版第四章课后习题解答
  8. 容器定义存储(CDS)—春江水暖Portworx先知
  9. docker跨主机网络——overlay与macvlan
  10. C语言ATM机模拟操作程序