前言

Hello,大家好,今天是早起的小泽!

早上10点相信对大家来说都还没有起来吧,当然有工作的除外,要上学的除外,相信还是有很多可以天天在家里待着的富婆鸭,会来这里偷偷地学习。

那么今天咱们是要搞什么呢?

相信通过标题你也是知道了,自动化!

那么话不多说,直接带大家起飞,好好学,好好问,你也可以成为大神!

什么是自动化

今天我们说到的自动化,不是你们可能听过很多的无人驾驶,机器人鸭什么的,就是没有那么高级哈。

这个自动化呢,在python里面用一个模块来实现:selenium

如果缺少这个东西呢,大家是有可能得抑郁症的,所以也可以看出来自动化对大家来说是多么的重要,还不赶紧学起来!

什么,你老抑郁了?

还没12点呢。

当然想只通过上面毫无关联的翻译来了解自动化,不太现实。

所以再给大家科普一下:

Selenium
是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9,10, 11),Mozilla Firefox,Safari,Google,Chrome,Opera等。这个工具的主要功能包括:测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成
.Net、Java、Perl等不同语言的测试脚本。

如果你还是看的不太明白,就可以这么理解:

selenium就是能帮我们自动浏览网页,自动获取那些我们能看到的数据。

总之呢,requests是属于黑暗里的一道光,而selenium就是光明正大的搞你,就是要搞你。

虽然上面说支持的浏览器有很多,但是还是推荐大家统一使用谷歌浏览器哈。

怎么安装selenium

又到了熟悉的教小白环节,小泽发现有很多人是直接学爬虫的诶,然后很多基础方面的,或者前端方面的知识鸭,就不太懂,这里可以花点时间把需要掌握的知识,系统的学一遍,毕竟不能急嘛,比的就是基本功。


直接开始教程,很快啊。


上面那个Project:1有的人可能找不到哦,因为你的项目名字不是1,找你的项目名字就好了,项目名字是最外层那个文件夹的名字哦。


找加号,有的人的加号可能在下面。


搜索selenium,然后点击左下方的下载,等你变绿了,就说明没毛病了嗷。

当然有的小伙伴可能会出现红色,下载失败,解决方法呢,在 一起学爬虫(Python) — 07 里面是有介绍的,在中间往下的部分,可以去找一找。


神奇の传送门1号

然后,模块我们就安装完成啦!

接下来就是重头戏了,要一起安装谷歌浏览器的引擎!

神奇の传送门2号

打开这个网址之前呢,大家先跟着小泽一起看一下自己谷歌浏览器的版本:


在帮助里面呢,有个关于Google Chrome,点进去。


你就能看到你的版本啦。

然后打开上面的传送门2号:


找到你对应的版本号的文件,然后点进去:


再根据自己的系统进行下载哈。

下载完了把里面的:


放在你能找得到的地方。

如果这些你都准备好了,那我们就可以开始了!

开冲!

最近小泽看到淘宝上有代冲的哦,10块钱一次,能让老板代替我们冲,如果大家实在忍不住可以去光顾一下,关爱自己,人人有责。

# 导入模块
from selenium import webdriver

第一步当然不用说啦,导入模块。对了,上面那个引擎,可以放在py文件的当前目录下哦,用的时候也方便!

# 这里指定自己的谷歌引擎目录
driver = webdriver.Chrome(executable_path='./chromedriver.exe')

今天,我们都是老司机!

上面那句是每次都要这样写的,所以不用纠结是为什么哦,Chrome就是谷歌的意思嘛~

from time import sleep
# 打开csdn的登录界面
driver.get('https://passport.csdn.net/login?code=public')
print('正在打开指定网页…')
sleep(1)

这里sleep1秒呢,是因为怕还没加载出来就继续下一步了,就有问题了。

先不要问代码为什么这么写,试试效果鸭!

# 找到那个输入账号密码的按钮
dl = driver.find_element_by_xpath('//*[@id="app"]/div/div/div[1]/div[2]/div[5]/ul/li[2]')
# 模拟点击
dl.click()
sleep(1)

先照样子复制,find_element_by_xpath就是根据xpath去找标签的位置哦,你也可以根据class,id等等…

刚进来的时候,我们是需要点一下这个账号密码登录的,所以就点击了这个标签对应的xpath。


第一步:输入账号

第二步:输入密码

第三步:点击登录

清楚了步骤,就让我们开始复制代码吧!

# 循环判断是否登陆成功
while True:user_number = input('输入你滴账号:')pass_word = input('输入你滴密码:')# 找到账号框input_num = driver.find_element_by_xpath('//*[@id="all"]')# 找到密码框password = driver.find_element_by_id('password-number')# 清空输入框input_num.clear()password.clear()# 把账号放进账号框input_num.send_keys(user_number)# 把密码放进密码框password.send_keys(pass_word)# 找到登录按钮btn = driver.find_element_by_xpath('//*[@id="app"]/div/div/div[1]/div[2]/div[5]/div/div[6]/div/button')# 点击登录按钮btn.click()sleep(1)# 取的目前的urlnow_url = driver.current_url# 判断是否登陆成功if now_url == 'https://www.csdn.net/':print('登陆成功!')sleep(1)breakelse:print('登陆失败!')choice = input('小可爱看一下你的账号是不是有风险了,需要验证码,是的话扣1,如果是密码错了就扣2:')if choice == '1':print('给你一分钟时间进行验证码的验证,你也可以手动把这个时间调的短一点!')sleep(60)elif choice == '2':print('好好输入密码!')continueelse:print('你在玩呢?')

相信聪明的你,一定能自己消化掉上面的代码,如果不能,没关系,下一期我们详细到每根毛孔都讲的清清楚楚! 先复制哈~

print('正在获取所有文章……')
# 前往存有所有博客url的那篇博客
driver.get('https://blog.csdn.net/BcXbHello/article/details/111560584')
sleep(1)
# 获取博客文本
data = driver.find_element_by_xpath('//*[@id="content_views"]/p').text
print('成功获取所有文章!')
sleep(1)
# 判断是否点赞
is_like = driver.find_element_by_xpath('//*[@id="is-like-span"]')
if is_like.text == '点赞':is_like.click()sleep(1)
# 处理url
data = data.split('|')[:-2]
for url in data:driver.get(url)is_like = driver.find_element_by_xpath('//*[@id="is-like-span"]')if is_like.text == '点赞':title = driver.find_element_by_xpath('//*[@id="articleContentId"]').textis_like.click()print(title+'点赞完毕!')sleep(1)
print('已经全部点赞完毕!坚决不做白嫖党,我爱小泽!!!')
# 退出调试
driver.quit()

注释呢,尽量的都写上去了,这一篇就先带着大家感受一下selenium的魅力~

结尾

也许聪明的你已经发现,这是一个防止白嫖的帖子,但是真的很有意思对不对~

点了赞,就是我的人了,好好听话,好好学习,下一篇给你看个大宝贝。


当然,有些懒家伙,不喜欢一个一个复制,这里也直接把所有代码都打出来好了:

from time import sleep
from selenium import webdriver# 这里指定自己的谷歌引擎目录
driver = webdriver.Chrome(executable_path='./chromedriver.exe')
# 打开csdn的登录界面
driver.get('https://passport.csdn.net/login?code=public')
print('正在打开指定网页…')
sleep(1)
# 找到那个输入账号密码的按钮
dl = driver.find_element_by_xpath('//*[@id="app"]/div/div/div[1]/div[2]/div[5]/ul/li[2]')
# 点击
dl.click()
sleep(1)
# 循环判断是否登陆成功
while True:user_number = input('输入你滴账号:')pass_word = input('输入你滴密码:')# 找到账号框input_num = driver.find_element_by_xpath('//*[@id="all"]')# 找到密码框password = driver.find_element_by_id('password-number')# 清空输入框input_num.clear()password.clear()# 把账号放进账号框input_num.send_keys(user_number)# 把密码放进密码框password.send_keys(pass_word)# 找到登录按钮btn = driver.find_element_by_xpath('//*[@id="app"]/div/div/div[1]/div[2]/div[5]/div/div[6]/div/button')# 点击登录按钮btn.click()sleep(1)# 取的目前的urlnow_url = driver.current_url# 判断是否登陆成功if now_url == 'https://www.csdn.net/':print('登陆成功!')sleep(1)breakelse:print('登陆失败!')choice = input('小可爱看一下你的账号是不是有风险了,需要验证码,是的话扣1,如果是密码错了就扣2:')if choice == '1':print('给你一分钟时间进行验证码的验证,你也可以手动把这个时间调的短一点!')sleep(60)elif choice == '2':print('好好输入密码!')continueelse:print('你在玩呢?')
print('正在获取所有文章……')
# 前往存有所有博客url的那篇博客
driver.get('https://blog.csdn.net/BcXbHello/article/details/111560584')
sleep(1)
# 获取博客文本
data = driver.find_element_by_xpath('//*[@id="content_views"]/p').text
print('成功获取所有文章!')
sleep(1)
# 判断是否点赞
is_like = driver.find_element_by_xpath('//*[@id="is-like-span"]')
if is_like.text == '点赞':is_like.click()sleep(1)
# 处理url
data = data.split('|')[:-2]
print(data)
for url in data:driver.get(url)is_like = driver.find_element_by_xpath('//*[@id="is-like-span"]')if is_like.text == '点赞':title = driver.find_element_by_xpath('//*[@id="articleContentId"]').textis_like.click()print(title+'点赞完毕!')sleep(1)
print('已经全部点赞完毕!坚决不做白嫖党,我爱小泽!!!')
# 退出调试
driver.quit()

一起学爬虫(Python) — 19 年轻人,进来学自动化相关推荐

  1. 老司机带你学爬虫——Python爬虫技术分享

    什么是"爬虫"? 简单来说,写一个从web上获取需要数据并按规定格式存储的程序就叫爬虫: 爬虫理论上步骤很简单,第一步获取html源码,第二步分析html并拿到数据.但实际操作,老 ...

  2. 学了python 以后能干啥-学python语言以后能干嘛?

    虽然有时觉得Python简单得不像编程语言,知乎上也有人说,"requests 好用的让人想哭".但当我们学习一门编程语言时,要学习哪些内容,怎么学习,还是很值得深入探究的. 先看 ...

  3. 学了python能干啥举例-学了Python可以做哪些有趣的东西

    Python是一种计算机程序设计语言,又被称为胶水语言,可以用混合编译的方式使用c/c++/Java等语言的库. 你可能已经听说过很多种流行的编程语言,比如在大学里感觉非常难学的C语言,进入社会非常流 ...

  4. python 数据分析学什么-python数据分析师要学什么

    数据分析师 是数据师Datician['detɪʃən]的一种,指的是不同行业中,专门从事行业数据搜集.整理.分析,并依据数据做出行业研究.评估和预测的专业人员. 1.数学知识(推荐学习:Python ...

  5. 学完了python能做什么-学完Python能做什么

    Python 是一种通用的脚本开发语言,比其他编程语言更加简单.易学,其面向对象特性甚至比Java.C#..NET更加彻底,因此非常适合快速开发.正是由于这些优点,Python颇受企业欢迎,而且学会了 ...

  6. python和c先学哪个-python和c先学哪个

    在知乎上看到这样一个话题:对于初学者而言Python和C先学哪个好? 有人觉得应该从C语言开始入门,原因如下:(推荐学习:Python视频教程) 1.C语言是你上大学第一门接触的编程语言,可见它的重要 ...

  7. python零基础能学吗-python零基础能学吗

    Python是一门高级编程语言,而且Python语言适合零基础人员学习,也是初学者的首选. 如何学习好Python: 1. 要有决心 做任何事情,首先要有足够的决心和坚持,才能做好事情.学好Pytho ...

  8. 学完python能做什么-学完Python开发可以从事哪些行业?

    Python开发培训前景如何?现在互联网巨头,都已经转投到人工智能领域,而人工智能的首选编程语言就是python,未来前景显而易见. 无论是学习任何一门语言,基础知识,就是基础功非常重要,找一个有丰富 ...

  9. python和c先学哪个-Python和C先学哪个好?

    非计算机专业的人,学习编程最重要的是保持住兴趣,而不是纠结技能树的问题,其实学什么语言都可以,因为语言都是互通的,C语言也好, 对于初学者来说,Python 也很适合. 有人觉得应该从C语言开始入门, ...

  10. 学完python能做什么-学完Python后能做什么?

    学习Python之后可以做什么工作: 第一:Python web开发 学完Python可以做web开发,因为现在中国学习Python的比较少,而招聘Python的却非常的多.所以Python web是 ...

最新文章

  1. Fibonacci(斐波纳契)数列各种优化解法
  2. Nginx 日志中记录cookie
  3. 25个优秀的jQuery滑块教程和插件
  4. HDU -2243 考研路茫茫——单词情结(AC自动机+矩阵快速幂)
  5. python xlsx 大文件_Python这样操作能存储100多万行的xlsx文件!Python让你事半功倍!
  6. 【WebRTC---进阶篇】(一)服务器基础编程
  7. 如果恶魔给你一亿,一年之后必须还两个亿,你会接受吗?
  8. 计算机共享文件登录人员记录,如何查看共享文件夹的访问记录,查看共享文件访问日志?...
  9. 信创云:打造自主可控云基础设施 | 厂商征集
  10. LVS-NAT基于NFS存储部署Discuz
  11. 读书百客:《游终南山》赏析
  12. C语言有必要学的很深入细致吗?
  13. 关于通过前端xslx解析excel日期格式数据转化问题以及自定义时间格式YYYY-MM-DD转化
  14. 计算机二级vbf课百度云,计算机二级易错易混选择题.
  15. 神舟GX8的强冷模式,其他神船伙伴也可以试一试
  16. word中的破折号中间有空格?
  17. 缓冲区溢出攻击实验(一)
  18. 物联网通信原理第4章 中远距离无线通信技术
  19. vue中的生命周期函数都在什么时候执行?
  20. 0009基于51单片机智能门禁系统设计

热门文章

  1. vue中swiper,vue-awesome-swiper实现轮播;鼠标移入暂停,移除播放;点击暂停按钮暂停,再点击播放。
  2. ConditionalDetr论文解读+核心源码解读
  3. JAVA实现负载均衡
  4. windows7内部版本7601此副本不是正版 桌面背景黑屏
  5. 汽车诊断协议:K线/CAN线、kwp2000、ISO14230、ISO1575、SAEJ1939
  6. 矢量信号发生器与射频信号发生器的区别是什么?
  7. 获取QQ音乐排行榜数据
  8. Robust Medical Instrument Segmentation Challenge 2019拜读
  9. 小赛毛游C记——初识C语言(1)
  10. 和el-dialog同级的列表被push数据后for循环渲染失效,列表不更新