原装requests

>>> import requests
>>> response = requests.get('http://www.baidu.com')
>>> response.text 打印源代码
>>> response.headers
{'Cache-Control': 'private, no-cache, no-store, proxy-revalidate, no-transform', 'Connection': 'Keep-Alive', 'Content-Encoding': 'gzip', 'Content-Type': 'text/html', 'Date': 'Mon, 26 Nov 2018 00:21:32 GMT', 'Last-Modified': 'Mon, 23 Jan 2017 13:28:36 GMT', 'Pragma': 'no-cache', 'Server': 'bfe/1.0.8.18', 'Set-Cookie': 'BDORZ=27315; max-age=86400; domain=.baidu.com; path=/', 'Transfer-Encoding': 'chunked'}
>>> response.status_code
200

>>> headers = {'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36'}
>>> response = requests.get('http://www.baidu.com',headers=headers) 添加了header头部

二进制文件的打印,图片文件处理

>>> response = requests.get('https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1543204467171&di=19de509bd81641d74f3ac61472898d8e&imgtype=0&src=http%3A%2F%2Fimage.biaobaiju.com%2Fuploads%2F20180803%2F20%2F1533299921-zRLwijpYoE.jpg')
>>> response.content 输出二进制文件
>>> with open('./1.jpg','wb') as f:
... f.write(response.content)

使用selenium模拟浏览器的操作

>>> from selenium import webdriver
>>> driver.get('http://m.weibo.cn') # 打开微博
>>> driver.get('http://www.zhihu.com') # 打开知乎
>>> driver.get('http://www.taobao.com') #打开淘宝
>>> driver.page_source #获取网页源代码

转载于:https://www.cnblogs.com/carious/p/10018428.html

python爬虫用到的一些东西相关推荐

  1. python爬虫什么意思-python爬虫可以爬什么

    Python爬虫可以爬取的东西有很多,Python爬虫怎么学?简单的分析下: 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python ...

  2. python爬虫从入门到放弃(一)初识爬虫

    在家里呆了几个月,重新拾起python爬虫,想着搞点东西(爱情电影)看看,发现爬虫真的是好开心. 网络爬虫是什么呢? 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者) ...

  3. Python爬虫副业真的可行吗?能赚多少?

    首先回答你,python爬虫能当副业,副业的方式比较多,等下我会讲几种. 到哪个层次能接单,主要看你是接什么样的单,爬一些资料,视频这种简单的学一两个月就没什么问题,复杂的那就需要系统的学习,爬虫原理 ...

  4. Python爬虫能当副业吗?到了那个层次才能接兼职?

    Python爬虫能当副业,副业的方式比较多. 到哪个层次能接单,主要看你是接什么样的单,爬一些资料,视频这种简单的学一两个月就没什么问题,复杂的那就需要系统的学习,爬虫原理,html相关知识,urll ...

  5. Python 异步,协程,学起来好头疼,Python爬虫程序能调用GPU去爬东西吗?

    78 技术人社群日报时间 文章目录 Python 爬虫程序能调用 GPU 去爬东西吗? Python 异步,协程--,学起来好头疼 有没有牛子大的说下 `matplotlib` 里 `plot` 和 ...

  6. python爬虫是什么意思?,Python爬虫是什么东西

    Python爬虫是什么? 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本. 另外一些不常使用的名字还有蚂 ...

  7. python爬虫抓取信息_python爬虫爬取网上药品信息并且存入数据库

    我最近在学习python爬虫,然后正好碰上数据库课设,我就选了一个连锁药店的,所以就把网上的药品信息爬取了下来. 1,首先分析网页 2,我想要的是评论数比较多的,毕竟好东西大概是买的人多才好.然后你会 ...

  8. Python爬虫获取文章的标题及你的博客的阅读量,评论量。所有数据写入本地记事本。最后输出你的总阅读量!

    Python爬虫获取文章的标题及你的博客的阅读量,评论量.所有数据写入本地记事本.最后输出你的总阅读量!还可以进行筛选输出!比如阅读量大于1000,之类的! 完整代码在最后.依据阅读数量进行降序输出! ...

  9. Python爬虫常见面试题(二)

    前言 之所以在这里写下python爬虫常见面试题及解答 一是用作笔记,方便日后回忆: 二是给自己一个和大家交流的机会,互相学习.进步,希望不正之处大家能给予指正: 三是我也是互联网寒潮下岗的那批人之一 ...

最新文章

  1. 如何找回由于IO设备错误移动磁盘的文件
  2. 【翻译自mos文章】OGG replicat 进程使用的 TCP port
  3. 9. 混合模型和EM(1)
  4. TensorFlow2-简介
  5. php调整表格样式,表格的创建以及样式修改
  6. 前端学习(2164):runtimeonly和runtimecompiler
  7. 基于JAVA+SpringMVC+Mybatis+MYSQL的个人相册管理系统
  8. ASP.NET 页面缓存 @ OutputCache
  9. window python环境搭建_Python入门-环境搭建详解(Window平台)
  10. 博文视点读书节第九日丨大咖书单加倍放送!
  11. 如何写出优质干净的代码,这6个技巧你不能错过
  12. 单门课程成绩管理系统用c语言,[转载]C语言课程设计——学生成绩管理系统
  13. Pycharm下了汉化包之后切换回英文界面
  14. USB接线定义和链接摄像头
  15. 百度wz竞价开户推广营销的四大好处
  16. 微信朋友圈卖货五大法则
  17. 使用python批量修改txt文件中的信息
  18. CSS高级篇——属性选择器 (attribute selectors)
  19. 可怕!CPU 竟成了黑客的帮凶
  20. JS设计模式(策略模式)

热门文章

  1. “科研女神”颜宁当选美国科学院外籍院士
  2. 书写是为了更好的思考
  3. 英语发音表及读法_在英语中年月日的读法和写法(附:英美时间表达差异辨析)...
  4. 004_FastDFS分布式添加多个tracker
  5. 052_Function对象
  6. centos打显卡驱动命令_CentOS7显卡驱动问题
  7. 数据结构和算法:全面的算法代码库
  8. Java高并发编程:多个线程之间共享数据的方式探讨
  9. RxJava 教程第一部分:为何使用RxJava
  10. PM——视屏操作软件