目标网址:http://mzsock.com 美足船袜网
你懂得!!

这里先给大家介绍一个python自带的库 :urllib.request
urllib.request --- 用于打开 URL 的可扩展库

使用库之前要引用,urllib.request是标准库,安装就自带,所以直接引用就好了!

官方文档:https://docs.python.org/zh-cn/3.7/library/urllib.request.html
大家可以自行查看和了解,也可以百度搜索了解它的用法!
引用方法

from urllib import request

你可以理解为从urllib包里使用request

这里为大家介绍 我们需要使用到urllib.request 库的用法,也是比较常用的用法:
1.urlopen
打开指定的网页

urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

url参数,可以是一个string,或者一个Request对象。 data一定是bytes对象,传递给服务器的数据,或者为None。目前只有HTTP requests会使用data,提供data时会是一个post请求,如若没有data,那就是get请求。data在使用前需要使用urllib.parse.urlencode()函数转换成流数据。

具体使用:
resp=request.urlopen('目标网址')
比如:打开百度

from urllib import requestresp=request.urlopen('http://www.baidu.com')
print(type(resp))
#可以看出,urlopen返回的是一个HTTPResponse对象

这里我们返回的是一个HTTPResponse对象,那么怎么变成我们想要的源码文本呢?
很简单,第二个用法,直接后面加.read()

2.req.read()
把我们想要的内容读取出来

response = request.urlopen(url)
req=response.read()

3.最后一个字符转换,你经过上面的步骤,你会发现返回的是乱码,其实返回的是bytes对象,这里我们需要转码我们熟悉的编码格式,一般是"utf-8",
后面直接加.decode("utf-8")
由于urlopen无法判断数据的encoding,所以返回的是bytes对象。一般会对返回的数据进行decode。

response = request.urlopen(url)
req=response.read()
req=req.decode('utf-8')

现在我们可以尝试打开我们想要爬取的目标网址了!

from urllib import requesturl = "http://mzsock.com"
response = request.urlopen(url)
print(response)
req=response.read()
print(req)
reqs=req.decode('utf-8')
print(reqs)

然后里用正则 提取我们想要的部分就可以了!!!

从零开始,手把手教你python爬取美足船袜网!相关推荐

  1. python爬取资料怎么样_手把手教你Python爬取新房数据

    原标题:手把手教你Python爬取新房数据 项目背景 新房数据,对于房地产置业者来说是买房的重要参考依据,对于房地产开发商来说,也是分析竞争对手项目的绝佳途径,对于房地产代理来说,是踩盘前的重要准备. ...

  2. 手把手教你Python爬取女神套图

    疲惫的生活里总要有些温柔梦想吧 目标URL:http://www.win4000.com/meinvtag4_1.html 爬取美桌网某个标签下的美女壁纸,点进详情页可以发现,里面是一组套图 一.网页 ...

  3. 福利!手把手教你Python爬取女神套图

    Python实战社群 Java实战社群 长按识别下方二维码,按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群▲ 作者:叶庭云 来源:凹凸数据 作者:叶庭云 CSDN ...

  4. 福利来了!手把手教你Python爬取女神套图

    疲惫的生活里总要有些温柔梦想吧 目标URL:http://www.win4000.com/meinvtag4_1.html 爬取美桌网某个标签下的美女壁纸,点进详情页可以发现,里面是一组套图 一.网页 ...

  5. python爬取2019年计算机就业_2019年最新Python爬取腾讯招聘网信息代码解析

    原标题:2019年最新Python爬取腾讯招聘网信息代码解析 前言 初学Python的小伙们在入门的时候感觉这门语言有很大的难度,但是他的用处是非常广泛的,在这里将通过实例代码讲解如何通过Python ...

  6. 【考公人的福利】Python爬取中公官网资料

    [考公人的福利]Python爬取中公官网资料 一.简述 二.代码 三.运行结果 一.简述 写这个代码的目的是能够高效率提取中公官网的资料,例如:申论.行测.面试热点.公安基础知识等.大家可以根据个人需 ...

  7. Python爬取 美剧《纸牌屋》字幕(可可英语)---BeautifulSoup版

    爬虫还是不会写,所以借鉴一个,仔细分析分析:https://blog.csdn.net/only_anan/article/details/80082316 1,导入爬取要用到的库,主要是是Beaut ...

  8. python爬取智联招聘网_Python-爬取智联招聘

    import urllib.request import urllib.parse from bs4 import BeautifulSoup import json import time clas ...

  9. Python爬取智联招聘网之贵阳python求职信息

    智联招聘(NYSE:ZPIN):为求职者提供免费注册.求职指导.简历管理.职业测评等服务的一个网站,它提供了丰富的求职信息,可以很快的查询到符合自己职位.如我查询贵州python职位需求的信息. 智联 ...

最新文章

  1. 老码农:这是我见过最操蛋的代码,切勿模仿!
  2. 问题 | 解决Intel MKL FATAL ERROR: Cannot load mkl_intel_thread.dll 问题(pycharm+Tensorflow)
  3. 安卓APP_ 控件(11)webView —— 简单应用:显示网页
  4. 什么是无线路由器网络协议?
  5. 一行代码引来的安全漏洞,就让我们丢失了整个服务器的控制权
  6. Go语言vscode环境配置
  7. Cmake 中相关具体介绍(包括Cmakelist.txt文件的编写等等)
  8. mysql装完是什么样儿的_Win7系统安装MySQL之后找不到指定文件与服务如何解决?...
  9. Feature Extractor[VGG]
  10. python的传参是传值还是传址
  11. Cleaning Bad Data in R R语言数据清理教程 Lynda课程中文字幕
  12. Maven基础篇之Maven的实战入门
  13. curviloft插件怎么用_Curviloft插件|SketchUp草图大师曲线放样插件(Curviloft)下载 v1.7d 免费版 - 比克尔下载...
  14. 纪念我的第一次面试——华为研发类面试
  15. database is locked错误
  16. php升序排列,php 基础问题表单里面怎么升序和降序?
  17. ICPC 2015 北京 Today Is a Rainy Day
  18. 烙铁使用注意事项及元器件件焊接要点
  19. ios开发之故事板StoryBoard的使用
  20. Ansible 自动化运维工具之inventory和常用模块介绍

热门文章

  1. java证书过期时间_我想用代码方式查看ca证书到期时间,以下是我的代码,可以显示日期,但是和实际的截止日期不一致...
  2. 对于RE文件管理器打开安卓手机的Sqlite文件速度很慢的解决办法
  3. Tomcat的下载、安装和使用(超详细讲解)
  4. 利用 Heritrix 构建特定站点爬虫
  5. 解决锐捷校园网环境下VMware虚拟机无法上网问题
  6. PC到PC之间怎么传送数据包?包括一个路由器,一个交换机,2台PC,由PCA发送经过交换机,路由器到PC2
  7. cip核字号验证_cip数据核字号的全称是什么
  8. 前端性能优化学习 08 资源加载优化
  9. 【CAD二次开发】第1.1 AutoCAD .NET API 基础《 了解 AutoCAD 对象层次》
  10. edge浏览器被百度占用了如何解决?