人生苦短,我用python;作为一种“胶水语言”,python为无数码农带来了便利;同时,越来越多的python工程师被标榜为”高薪党”;“全民python"的时代渐渐到来,你准备好了吗?

下面,就让我们用一个实例,具体地感受一下python 的魅力吧!

前期准备:Python版本:Python3

运行平台:Windows

IDE:PyCharm

浏览器:Chrome

项目介绍:

本项目利用 python 对网页上的图片进行爬取并下载,由于该网站较为简单、原始数据信息直白、无反爬干扰等,读者可从整体上直观地了解到爬虫的流程,适合大部分初学者;同时,该文章展示了源代码,且本项目上升空间很大,读者可将其加以延伸,在此不过多赘述。

网站信息:

http://qq.yh31.com/zjbq/0636124.html

具体步骤:

首先,我们导入第三方库,方便之后使用:import requests

from lxml import etree

from om urllib.request imp import urlretrieve

为操作规范,我们定义一个函数def getPhoto():

注:以下内容为函数内部内容,需整体向右缩进# 确定 url

url = "http://qq.yh31.com/zjbq/0636124.html"

# 发起请求

response = requests.get(url)

打开网页,查看源代码可知,应采用 “utf-8” 的编码格式

因此,添加如下代码:# 将 ASCII 格式转换为可包含中文格式的 utf-8

response.encoding = 'utf-8'

接下来,对目标网页的数据进行解析:# 将数据转化为 html 对象

html =  = etree.HTML(res(ML(response.text)

# 查找数据

data =  = html.xpath('//('//div[@class = "c_content_overflow"]/p/img/@src')

对网页进行拼接:# 定义num记录数据

num = 1

for photoStr in data:

urlStr = 'http://qq.yh31.com' + photoStr

注:以下内容全在for循环里

最后下载图片:

新建一个目录,在当前文件下依次操作:右键、选择 New、选择 Directory:

右键新建的目录,选择 Copy Path,复制目录路径:

之后用urlretrieve函数下载图片:# 注:其中“——?——”部分为刚才复制的路径

urlretrieve(urlStr,r'C:\Users\——?——\PycharmProjects\reptile\图片/%d.jpg'%num)

num += 1

# 其中%d.jpg'%num可实现动态命名

0K,后就调用函数了。getPhoto()

这是运行后的结果:

好了,这个简单的爬虫就写好了,希望能帮到大家。See You!

如何利用python破解qq_如何利用Python爬取QQ趣图相关推荐

  1. 【Python爬虫实战】使用Selenium爬取QQ音乐歌曲及评论信息

    本文对使用到的技术仅做简单的介绍,若想了解更多,请前往相应的官网网站进行学习. 本文适合对爬虫相关知识接触不多的新手,主要是普及Selenium如何做爬虫,大佬请跳过. 1.Selenium简单介绍 ...

  2. Python爬虫,手把手教你爬取QQ空间信息

    前言: 现在流行着一句话,遇事不要慌,朋友圈走一波.不知道还有多少人记得QQ空间,这可是QQ那个年代的青春啊,哎呀,不小心暴露了年龄.好了,废话不多说了,今天来教各位如何爬取QQ空间的信息. 环境搭建 ...

  3. 利用python爬取qq个性网图片

    利用python爬取qq个性网图片 网站头像布局大同小异,稍改代码即可爬取想要的头像. 不多bb,上代码. import requests from parsel import Selector im ...

  4. qq动态名片代码_利用Python动态爬取QQ说说并生成词云,分析朋友状况!

    今天我们要做的事情是使用动态爬虫来爬取QQ空间的说说,并把这些内容存在txt中,然后读取出来生成云图,这样可以清晰的看出朋友的状况. 这是好友的QQ空间10年说说内容,基本有一个大致的印象了. 爬取动 ...

  5. [python爬虫] 正则表达式使用技巧及爬取个人博客实例

    这篇博客是自己<数据挖掘与分析>课程讲到正则表达式爬虫的相关内容,主要简单介绍Python正则表达式爬虫,同时讲述常见的正则表达式分析方法,最后通过实例爬取作者的个人博客网站.希望这篇基础 ...

  6. Python项目实战:爬取QQ音乐中的付费歌曲

    2019独角兽企业重金招聘Python工程师标准>>> 前言 相信大家都很喜欢听音乐,在各种音乐平台上,今天为大家介绍一个利用Python爬取QQ付费音乐的案列,欢迎大家一起学习,一 ...

  7. Python爬虫实战系列(一)-request爬取网站资源

    Python爬虫实战系列(一)-request爬取网站资源 python爬虫实战系列第一期 文章目录 Python爬虫实战系列(一)-request爬取网站资源 前言 一.request库是什么? 二 ...

  8. 手把手教你Python爬取女神套图

    疲惫的生活里总要有些温柔梦想吧 目标URL:http://www.win4000.com/meinvtag4_1.html 爬取美桌网某个标签下的美女壁纸,点进详情页可以发现,里面是一组套图 一.网页 ...

  9. Python+Selenium动态网页的信息爬取

    录 一.Selenium 1.1 简介 1.2 配置 二.对百度进行自动化测试 2.1 进入百度搜索界面 2.2 自动填充百度网页的查询关键字并完成自动搜索 三.爬取指定网页的名言 3.1 找到元素 ...

最新文章

  1. 基于Shodan Python库的批量攻击实践 撒旦网
  2. python如何打开文件编辑界面_Python-PyQt5-图形可视化界面(5)--打开文件或文件夹--QFileDialog...
  3. 日本Blogger专用电脑
  4. 【python】过长代码换行续行方法
  5. easyui input输入框的限制和校验条件
  6. 数仓备机DN重建:快速修复你的数仓DN单点故障
  7. python的ols_【量化工具】OLS在python中的四种实现方式
  8. 为系统扩展而采取的一些措施——异步
  9. ES6、7学习笔记(尚硅谷)-6-形参默认值的设置
  10. Ansible自动化运维
  11. SQL语句的执行计划
  12. 清除微信或者企业微信的缓存或cookie
  13. VMware16阿里云盘
  14. werfault.exe出现的原因与解决办法以及werfault.exe 该内存不能为written如何解决?
  15. 小米平板2刷android,小米平板2怎么刷回MIUI 小米平板2刷回MIUI教程
  16. 手机游戏模型c语言提取,(游戏中模型资源的抓取软件)ninja ripper的使用方法...
  17. 03-----生产环境 CPU 占用过高,你如何解决?
  18. 戴尔(Dell)笔记本电脑开机后插上耳机没反应怎么办
  19. ubuntu 支持cuteFTP
  20. CentOS7下安装yara

热门文章

  1. 如何准备毕业论文写作——计算机毕业设计
  2. 为资产分类定义折旧范围_FI-AA配置逻辑
  3. css(显示与隐藏、溢出)
  4. 2007-05-13
  5. 【2019斯坦福CS224N笔记】(5)The probability of a sentence Recurrent Neural Networks and Language Models
  6. 借助新电商平台,湖北荷塘三宝直达全国餐桌
  7. 【字节跳动暑期实习】计算机视觉实习生-互娱研发-抖音/抖音火山版/直播/影像
  8. Android之近场通信技术
  9. Medium上的文章
  10. Android客户端——寒假实习面经-实习初体验