Python的爬虫很强大,可以高效的提取网站信息,省时省力高效。瞎掰这么多犹如纸上谈兵,下面把这周的部分成果放出来。

爬取京东商品页面信息

1.我们需要从python中安装一个requests库--------在windows 系统下,只需要输入命令pip install requests即可安装。

输入import requests验证是否安装成功。(注意,俩单词中间只有一个空格哦!)

(图示为安装成功)

2.插入链接,我们爬取京东的一款电脑,链接如下https://item.jd.com/55983367371.html-----输入r=requests.get("https://item.jd.com/55983367371.html")

3.输入r.status_code查看状态码,200为正常。(如果不是两百,文章最后有解决办法)

4.我们查看他的编码信息----r.encoding

5.最后,输入r.text[:1000]获取信息

大多数情况会出现异常情况:

这是被京东的网站截住了,你想去人家的大学大摇大摆拍照,被保安大爷大喝一声“站住!”,把你拦截了。

咋回事?

你把你的真实面目展现给了对方。

咱好歹得伪装一下,给京东的兄弟留点面子。

输入r.request.headers查看他的头部份,

说明我们如实的告诉了门岗,有一个叫 'python-requests/2.24.0'的小毛孩儿想要扒你的信息,大爷当然就六亲不认了,但是没有关系,我们可以装作一个浏览器访问。

解决方案

依次输入:

kv = {'user-agent':'Mozilla/5.0'}

url ="https://item.jd.com/55983367371.html"

r = requests.get(url, headers = kv)

每次输完不要忘记回车哦。

一顿操作猛如虎,成功伪装成浏览器,名字叫做Mozilla/5.0

再操作,Victory

同理,如果状态码异常了(非200),再进行同样的操作就OK了!

赶紧找个其他的商品试试吧!

原文链接:https://blog.csdn.net/m0_46565226/article/details/108327609

51自学网python爬虫_自学Python爬虫实战(小白篇)相关推荐

  1. 第一章 第一节:Python基础_认识Python

    Python基础入门(全套保姆级教程) 第一章 第一节:Python基础_认识Python 1. 什么是编程 通俗易懂,编程就是用代码编写程序,编写程序有很多种办法,像c语言,javaPython语言 ...

  2. 日本python教材_自学python:完整入门python书单!

    小伙伴总在询问Python的书,哎呀,动力所致,书单来了.9本,涵盖范围蛮大的.Python热持续中,入门计算机首选语言... 1.<父与子的编程之旅> 关注威信工宗号:程序员大牛,即可领 ...

  3. python编辑器_自学python第一课之下载安装编辑器

    一.Python编辑器安装 第一步:打开下载好的安装包,点击python3.7安装环境: 第二步:注意:一定要勾选上add Python 3.7 to PATH,不然就不会自动添加到系统环境变量里,可 ...

  4. 福州python招聘_【Python程序员招聘|Python程序员最新招聘信息】-看准网

    立即投递 职位薪资:6000-10000 经验:不限 学历:不限 类型:全职 linux下python编程 对接ai平台做应用 立即投递 职位薪资:8000-13000 经验:不限 学历:本科 类型: ...

  5. 一步一步学python爬虫_初学Python之爬虫的简单入门

    初学Python之爬虫的简单入门 一.什么是爬虫? 1.简单介绍爬虫 爬虫的全称为网络爬虫,简称爬虫,别名有网络机器人,网络蜘蛛等等. 网络爬虫是一种自动获取网页内容的程序,为搜索引擎提供了重要的数据 ...

  6. 手机写python爬虫_可以写爬虫的那么多,为什么只有python火了?

    网络爬虫: 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模 ...

  7. 51自学网,各种软件自学视频的地方

    http://www.51zxw.net/study.asp?vip=10777676 [url=http://www.51zxw.net/study.asp?vip=10777676]51自学网-专 ...

  8. python批量自动填写网页表单_使用python+selenium帮助你填写网站表单

    应用场景:频繁往网站.电商平台后台等填写数据. 工作场景:电商上传商品.测试人员.批量提交表单等. 涉及内容:python读写EXCEL文件.selenium基础使用.Xpath基础使用.python ...

  9. 如何用python赚钱_利用python能怎么挣钱

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 6年python,期间写了各种奇葩爬虫,挣各种奇葩的钱,写这篇文章总结下几种爬虫 ...

  10. 复旦大学python培训_复旦大学Python之子高质量解读:Python400集视频教程+python电子书大合集...

    Python 简介: Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具 ...

最新文章

  1. s6-9 TCP 定时器
  2. EntityFramework Core 5.0 VS SQLBulkCopy
  3. Power Network POJ - 1459(EK算法模板+详解)
  4. mysql最小费用最大流问题_最小费用最大流问题
  5. matlab butter 低通,matlab butter 用法
  6. java语言是那年_Java语言是在()年正式推出的_学小易找答案
  7. wine 运行QQ的问题
  8. linux修改vcf编码格式,飞翔vcf文件编码转换
  9. 重装系统开机蓝屏0x0000007E错误但是可以进入安全模式
  10. 俄罗斯计算机水平_从四点到三十二点。 俄罗斯计算机和网络的早期
  11. 什么是 Scrum 中的 Timeboxing?
  12. 如何利用小程序布局社交电商?
  13. 【Java爬虫-模拟淘宝登录】
  14. 基于python的阴阳师后台辅助
  15. 【Qt象棋游戏】08_人机博弈高阶算法
  16. 8月30日--全天课程--马哥培训
  17. Java小项目-银行用户管理系统
  18. USB小风扇IC方案电路原理图免费下载
  19. 济南计算机学校排名2015,山东济南初中排行榜TOP10
  20. win版敬业签怎么通过便签快捷键对便签内容执行标记已完成操作?

热门文章

  1. 牺牲小我,完成 DELL (误)
  2. 计算机领域相关期刊会议及排名
  3. Marketiva外汇平台
  4. 穆迪ESG解决方案事业部推出解决方案,帮助投资者评估各公司是否遵循联合国全球契约组织原则
  5. php 图片 字母识别,PHP+百度AI OCR文字识别实现了图片的文字识别功能
  6. twelfth day for learning
  7. Python 时间复杂度计算
  8. zsh: command not found: workon
  9. vi / vim编辑器
  10. 新坐骑,新道具,新的梦幻外传-梦幻奇游web