requests:

  response.text       以 unicode 格式显示响应的文本

  response.content    以 二进制 格式显示响应的文本

BeautiSoup:

  soup = BeautifulSoup (response.text,解析方式)  常用的解析方式有 "html.parser"  "lxml"

  soup.prettify()  美化文本方便查看

  soup.seleect(#id)  soup.seleect(.class)  例如 select("#buy_immediately_bottom") 定位id为buy_immediately_bottom的那(些)元素

  soup.find_all (xx)  查询所有的xx

  soup.find(xx)  查询第一个出现的xx,相当于 soup.find_all(xx,limit=1)

import json

json.loads("字典格式的文本"),处理后的结果就是字典

转载于:https://www.cnblogs.com/springbrotherhpu/p/8227854.html

requests + BeautifulSoup + json相关推荐

  1. 爬虫之requests+BeautifulSoup详解

    简介 Python标准库中提供了:urllib.urllib2.httplib等模块以供Http请求,但是,它的 API 太渣了.它是为另一个时代.另一个互联网所创建的.它需要巨量的工作,甚至包括各种 ...

  2. python+requests+beautifulsoup爬取大众点评评论信息

    特别声明,此文写于2018年2月,大众点评的页面逻辑,已做了改动,请找最近爬的文章看下,谢谢支持. 先简单聊两句,距离上一篇博客大概过去了4个月,在忙一些别的事情,除了公司有新项目上线,学习新技术之外 ...

  3. requests(二): json请求中固定键名顺序消除键和值之间的空格

    继上一篇requests发送json请求的文章后,实际工作中遇到了以下2种情况. 1:服务端要求json字符串,键名的顺序固定  2.服务端对于接收到的json数据中,若key和value之间有空格, ...

  4. Crawler:基于requests库+json库+40行代码实现爬取猫眼榜单TOP100榜电影名称主要信息

    Crawler:基于requests库+json库+40行代码实现爬取猫眼榜单TOP100榜电影名称主要信息 目录 输出结果 实现代码 输出结果 实现代码 # -*- coding: utf-8 -* ...

  5. aspx网页背景图片设置代码_python requests,BeautifulSoup批量下载360图片

    本代码演示通过python的requests,BeautifulSoup库批量下载360图片,并保存在本机的路径 代码如下: #BeautifulSoup库是网页爬虫解析库,主要用来对HTML源代码进 ...

  6. python 爬虫(一) requests+BeautifulSoup 爬取简单网页代码示例

    以前搞偷偷摸摸的事,不对,是搞爬虫都是用urllib,不过真的是很麻烦,下面就使用requests + BeautifulSoup 爬爬简单的网页. 详细介绍都在代码中注释了,大家可以参阅. # -* ...

  7. 使用python抓取并分析数据—链家网(requests+BeautifulSoup)(转)

    本篇文章是使用python抓取数据的第一篇,使用requests+BeautifulSoup的方法对页面进行抓取和数据提取.通过使用requests库对链家网二手房列表页进行抓取,通过Beautifu ...

  8. 当当网畅销书排行爬虫(requests+BeautifulSoup)

    今天要做的是一个爬取当当网畅销书排行的爬虫,之后想看排行直接运行程序就可以看到啦,没有多余的信息,是不是很给力! 在前两次的爬虫编写过程中,思想都是把整个HTML文档看做一个很长很长的字符串,通过编写 ...

  9. python战反爬虫:爬取猫眼电影数据 (一)(Requests, BeautifulSoup, MySQLdb,re等库)

    姓名:隋顺意 博客:Sui_da_xia 微信名:世界上的霸主 本篇文章未涉及猫眼反爬,主要介绍爬取无反爬内容,战反爬内容请去 python战反爬虫:爬取猫眼电影数据 (二)(Requests, Be ...

最新文章

  1. 看完这篇还不懂Redis的RDB持久化,你们来打我!
  2. python四个带 key 参数的函数(max、min、map、filter)
  3. 麻烦的.text字段
  4. 使用js对来判断一个字符串中括号是否平衡匹配
  5. 自动生成 指定范围日期 生成字符串格式时间日期 --计算连续时间 SQL
  6. XCTF-MISC-新手区-功夫再高也怕菜刀
  7. python爬虫的数据如何解决乱码_写爬虫时如何解决网页乱码问题
  8. 微信小程序开发 | 官方问答精选
  9. firefox 开源_Firefox 10岁了,Microsoft开源了更多,等等
  10. MySQL日期处理-查询间隔数据
  11. 网站建设页面设计中CSS正确书写
  12. PYTHON_SPLIT
  13. 基于Python的汉语分词系统
  14. Openwrt编译教程:从头开始所有步骤(日志记录)
  15. Homegrown【翻译】
  16. Blender学习入门(一)-Blender的下载和插件安装
  17. python绘制qq图_Python中作QQ图(quantilequantile Plot)
  18. hicharts堆叠柱状图堆叠数据标签显示百分比
  19. 总结27 -- E45: ‘readonly‘ option is set (add ! to override)
  20. 景联文科技|浅谈常见的语音标注方法

热门文章

  1. 菜鸟学Linux 第033篇笔记 bootloader,inittab
  2. 设计模式(行为型模式)——访问者模式(Visitor)
  3. php 打印测试技巧
  4. Samba服务器的安装配置和应用
  5. 暴汗,今天遇到个奇事
  6. linux的ulimit各种限制之深入分析
  7. Oracle RAC禁用DRM
  8. springMvc解决json中文乱码
  9. 使用AMDU工具从无法MOUNT的DISKGROUP中抽取数据文件
  10. Ajax框架及原理分析--视频